Gaussian Distribution

概率论中最重要的连续分布，从最大熵原理、中心极限定理、微分方程三个角度推导。

Overview

高斯分布（正态分布）是机器学习和统计学的基石。它的重要性不仅体现在数学上的优雅（均值和方差完全刻画分布），更在于中心极限定理保证了它在自然界中的普适性。

辉少的博客从三个不同角度推导了高斯分布的 PDF，展示了其深刻的数学根源。

一维高斯：\(f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(x - \mu)^2}{2\sigma^2}\right)\)
多维高斯：\(f(x) = \frac{1}{(2\pi)^{n/2} |\Sigma|^{1/2}} \exp\left( -\frac{1}{2} (x - \mu)^T \Sigma^{-1} (x - \mu) \right)\)

约束：已知均值 \(\mu\) 和方差 \(\sigma^2\)，求使熵最大的分布
拉格朗日函数：\(L = -\int f \ln f \, dx + \lambda_0(\int f dx - 1) + \lambda_1(\int xf dx - \mu) + \lambda_2(\int (x-\mu)^2 f dx - \sigma^2)\)
变分求解得：\(\ln f(x) = -1 + \lambda_0 + \lambda_1 x + \lambda_2 (x-\mu)^2\)
代入约束确定系数，最终得到高斯 PDF
核心洞察：高斯分布是在给定一阶、二阶矩约束下"最不确定"（熵最大）的分布