Hui

Hui

We create the world, we change the world

Gaussian Distribution

Gaussian Distribution

概率论中最重要的连续分布，从最大熵原理、中心极限定理、微分方程三个角度推导。

Overview

高斯分布（正态分布）是机器学习和统计学的基石。它的重要性不仅体现在数学上的优雅（均值和方差完全刻画分布），更在于中心极限定理保证了它在自然界中的普适性。

辉少的博客从三个不同角度推导了高斯分布的 PDF，展示了其深刻的数学根源。

Key Facts / Claims

概率密度函数

一维高斯：$f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(x - \mu)^2}{2\sigma^2}\right)$
多维高斯：$f(x) = \frac{1}{(2\pi)^{n/2} \Sigma ^{1/2}} \exp\left( -\frac{1}{2} (x - \mu)^T \Sigma^{-1} (x - \mu) \right)$

推导一：最大熵原理

约束：已知均值 $\mu$ 和方差 $\sigma^2$，求使熵最大的分布
拉格朗日函数：$L = -\int f \ln f \, dx + \lambda_0(\int f dx - 1) + \lambda_1(\int xf dx - \mu) + \lambda_2(\int (x-\mu)^2 f dx - \sigma^2)$
变分求解得：$\ln f(x) = -1 + \lambda_0 + \lambda_1 x + \lambda_2 (x-\mu)^2$
代入约束确定系数，最终得到高斯 PDF
核心洞察：高斯分布是在给定一阶、二阶矩约束下”最不确定”（熵最大）的分布

推导二：中心极限定理

$n$ 个独立同分布随机变量之和的标准化形式：$S_n = \frac{\sum X_i - n\mu}{\sigma\sqrt{n}}$
当 $n \to \infty$ 时，$S_n \to \mathcal{N}(0,1)$
核心洞察：大量微小独立因素的叠加必然趋于高斯分布

推导三：微分方程

假设 $\frac{d}{dx}(\ln f(x)) = -\frac{x-\mu}{\sigma^2}$
解得 $\ln f(x) = -\frac{(x-\mu)^2}{2\sigma^2} + C$
核心洞察：对数密度的线性变化率假设直接导出高斯形式

[[kl-divergence]] — 两个高斯分布之间的 KL 散度推导
[[spherical-gaussian]] — 协方差矩阵为 $\sigma^2 I$ 的特殊情形
[[gaussian-posterior]] — 高斯先验 + 线性高斯似然的后验推导
[[machine-learning-basics]] — Fisher LDA 中假设类条件分布为高斯
[[diffusion-model]] — 前向扩散过程的核心就是高斯噪声注入

Sources

高斯分布的数学推导详解 — 辉少的博客原文