贝叶斯分类和决策边界

August 31, 2024 less than 1 minute read

贝叶斯分类器的后验概率公式推导

基本定义和公式

每个类别 $w_i$ 都有一个先验概率 $p(w_i)$，并且对于所有类别来说，先验概率之和为1：

\[\sum_{k=1}^K p(w_k) = 1\]

对于两类分类问题，我们通常有：

\[p(w_1) + p(w_2) = 1\]

贝叶斯规则应用

后验概率 $p(w_i|x)$ 是在给定观测数据 $x$ 后，某个特定类别 $w_i$ 的条件概率，根据贝叶斯规则，可以表示为：

\[p(w_i|x) = \frac{p(x|w_i)p(w_i)}{p(x)}\]

其中，$p(x)$ 是证据因子，表示所有类别生成数据 $x$ 的概率：

\[p(x) = \sum_{k=1}^{K} p(x|w_k)p(w_k)\]

两类分类问题的具体推导

对于两类问题，后验概率 $p(w_1|x)$ 的计算可以简化如下：

\[p(w_1|x) = \frac{p(x|w_1)p(w_1)}{p(x|w_1)p(w_1) + p(x|w_2)p(w_2)}\]

进一步化简为：

\[p(w_1|x) = \frac{1}{1 + \frac{p(x|w_2)p(w_2)}{p(x|w_1)p(w_1)}}\]

设 ( x ) 的条件概率密度为正态分布，则：

\[p(x|w_i) = \frac{1}{\sqrt{2\pi \sigma_i^2}} \exp \left( -\frac{(x - m_i)^2}{2\sigma_i^2} \right)\]

代入上述正态分布得：

\[p(w_1|x) = \frac{1}{1 + \exp \left( -\left[ \frac{(x - m_1)^2}{2\sigma_1^2} - \frac{(x - m_2)^2}{2\sigma_2^2} \right] + \ln \left( \frac{\sigma_2 \cdot p(w_2)}{\sigma_1 \cdot p(w_1)} \right) \right)}\]

等方差和等先验概率的情况

如果两个类别的方差相同$\sigma_1 = \sigma_2$并且先验概率也相同$p(w_1) = p(w_2)$，该公式进一步简化，分类界限当 $p(w_1|x) = 0.5$ 时，解析表达式为：

\[x = \frac{m_1 + m_2}{2}\]

这种情况下，分类器退化为简单的距均值分类器（即最近均值分类器）。

多元情况下的分类边界

对于多元特征的情况，后验概率的推导涉及协方差矩阵，对于类别$w_1$ 和 $w_2$，假设它们有不同的协方差矩阵 $C_1$ 和 $C_2$，分类界限可表示为一个二次方程：

$$x^T (C_1^{-1} - C_2^{-1}) x + 2x^T (C_1^{-1} m1 - C_2^{-1} m2) + m1^T C_1^{-1} m1 - m2^T C_2^{-1} m2 - \ln \left| \frac{C2}{C1} \right| - 2 \ln \left( \frac{p(w1)}{p(w2)} \right) = 0$$

这种情况下，决策边界是二次的，依赖于协方差矩阵的差异。

贝叶斯分类和决策边界

贝叶斯分类器的后验概率公式推导

基本定义和公式

贝叶斯规则应用

两类分类问题的具体推导

等方差和等先验概率的情况

多元情况下的分类边界

Leave a comment

You may also enjoy

DDPM 数学推导

DDPM 与 Score Matching 的统一推导与『为什么要这样做』

2024

U-Net中的下采样和上采样运算符并不总是必要的