Poisson 分布:概率质量函数的推导过程
Poisson 分布用于描述在固定时间或空间内稀有事件发生的次数,比如电话呼叫中心的呼叫数量、银行中的顾客到达率、交通事故的发生频率等。Poisson 分布的概率质量函数(p.m.f.)是通过二项分布的极限推导出来的。在这个推导过程中,我们将逐步分析二项分布并得到 Poisson 分布的公式。
二项分布的引入
假设一个事件在每个时间段内发生的概率为 $p$,总共观察了 $n$ 个独立的时间段。在这种情况下,事件在 $n$ 次观察中恰好发生 $k$ 次的概率服从二项分布:
\[P(X = k) = \binom{n}{k} p^k (1 - p)^{n - k}\]其中,$X$ 表示事件发生的次数,组合数 $\binom{n}{k}$ 代表从 $n$ 次观察中挑选出 $k$ 次发生事件的方式数。
设定稀有事件的参数
Poisson 分布描述的是单位时间内事件的发生次数,所以我们设单位时间内事件的平均发生次数为 $\lambda$。在二项分布中,将每次观察事件发生的概率 $p$ 表示为一个函数 $\frac{\lambda}{n}$,即
\[p = \frac{\lambda}{n}\]这样设置的两个条件是:
- 当 $n \to \infty$ 时,$p \to 0$(单次发生的概率很小);
- 总期望值 $np = \lambda$ 保持常数不变。
将 $p = \frac{\lambda}{n}$ 代入二项分布的公式:
\[P(X = k) = \binom{n}{k} \left(\frac{\lambda}{n}\right)^k \left(1 - \frac{\lambda}{n}\right)^{n - k}\]对公式中的各项进行近似展开:
-
组合数的近似:当 $n \to \infty$ 且 $k \ll n$ 时,组合数可以近似为:
\[\binom{n}{k} = \frac{n!}{k!(n - k)!} \approx \frac{n^k}{k!}\] -
幂次项的近似:对于 $\left(1 - \frac{\lambda}{n}\right)^{n - k}$,当 $n \to \infty$ 时,可以使用极限公式 $\lim_{n \to \infty} \left(1 - \frac{\lambda}{n}\right)^n = e^{-\lambda}$。因此,
\[\left(1 - \frac{\lambda}{n}\right)^{n - k} \approx e^{-\lambda}\]
将以上近似代入公式,得到:
\[P(X = k) \approx \frac{n^k}{k!} \left(\frac{\lambda}{n}\right)^k e^{-\lambda}\]进一步化简后得出:
\[P(X = k) \approx \frac{\lambda^k}{k!} e^{-\lambda}\]得到 Poisson 分布的概率质量函数
通过以上推导,我们得到 Poisson 分布的概率质量函数:
\[f(k|\lambda) = P(X = k) = \frac{e^{-\lambda} \lambda^k}{k!}\]其中,$k = 0, 1, 2, \dots$,$\lambda$ 是单位时间内事件的平均发生次数。这个公式描述了在单位时间内,事件发生 $k$ 次的概率。
总结
Poisson 分布的概率质量函数通过二项分布的极限推导而来,适用于描述单位时间或空间内独立、稀有事件的发生次数。这种分布广泛应用于电信、交通和制造业中来描述随机事件的发生频率。
Leave a comment