Skip to content

Gaussian Posterior

高斯先验 + 线性高斯似然的后验分布推导,贝叶斯推断的解析范例。

Overview

当先验和似然都是高斯分布时,后验分布也有闭式解析解——仍然是高斯分布。这是贝叶斯推断中最优雅的结果之一,广泛应用于卡尔曼滤波、高斯过程、变分推断等领域。

辉少的博客完整推导了一维情形:先验 \(p(x) = \mathcal{N}(\mu_A, \sigma_A^2)\),似然 \(p(y|x) = \mathcal{N}(ax, \sigma_B^2)\)

Key Facts / Claims

后验分布形式

  • 后验:\(p(x|y) = \mathcal{N}(\tilde{\mu}, \tilde{\sigma}^2)\)
  • 后验精度(方差的倒数):\(\tilde{\sigma}^{-2} = \sigma_A^{-2} + a^2\sigma_B^{-2}\)
  • 后验均值:\(\tilde{\mu} = \tilde{\sigma}^2 \left(\sigma_A^{-2}\mu_A + a\sigma_B^{-2}y\right)\)

推导关键步骤

  1. 贝叶斯定理:\(p(x|y) \propto p(y|x)p(x)\)
  2. 指数部分展开:\(-\frac{(y-ax)^2}{2\sigma_B^2} - \frac{(x-\mu_A)^2}{2\sigma_A^2}\)
  3. 整理 \(x^2\) 项系数:\(A = \frac{a^2}{\sigma_B^2} + \frac{1}{\sigma_A^2}\)
  4. 整理 \(x\) 项系数:\(B = \frac{2ay}{\sigma_B^2} + \frac{2\mu_A}{\sigma_A^2}\)
  5. 完成平方:\(-\frac{A}{2}(x - \frac{B}{2A})^2 + \text{const}\)
  6. 读出高斯参数:\(\tilde{\sigma}^2 = \frac{1}{A}\)\(\tilde{\mu} = \frac{B}{2A}\)

直观理解

  • 精度相加:后验精度 = 先验精度 + 似然精度(加权)
  • 均值加权:后验均值是先验均值和观测值的加权平均,权重与各自的精度成正比
  • 观测噪声越小(\(\sigma_B^2\) 越小),后验越向观测值 \(y/a\) 靠拢
  • [[gaussian-distribution]] — 高斯分布的基础推导
  • [[spherical-gaussian]] — 高斯分布的简化形式
  • [[machine-learning-basics]] — 贝叶斯分类器的核心思想
  • [[vae]] — 变分自编码器中编码器输出高斯后验 \(q(z|x)\)

Sources