什么是泊松分布?

泊松分布(Poisson Distribution)是一种离散概率分布,用于描述在固定时间或空间间隔内随机事件发生的次数。它由法国数学家西莫恩·德尼·泊松在1837年提出,是概率论中最重要的分布之一。

泊松分布的概率质量函数(PMF)

泊松分布的概率质量函数定义为:

$$P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!}$$

其中:

  • \(k\) 是事件发生的次数 (k = 0, 1, 2, ...)
  • \(\lambda\) 是单位时间(或单位面积)内事件发生的平均次数
  • \(e\) 是自然对数的底数 (约等于2.71828)

泊松分布的性质

期望和方差

泊松分布的期望值(均值)和方差都等于参数 \(\lambda\):

$$E(X) = \lambda$$

$$Var(X) = \lambda$$

无记忆性

泊松过程具有无记忆性,即未来事件发生的概率与过去事件无关。

事件独立性

在不相交的时间区间内,事件发生的次数是相互独立的。

稀有事件

泊松分布适用于描述稀有事件,即事件发生的概率很小而试验次数很大时。

泊松分布的应用场景

泊松分布在现实生活中有广泛的应用,以下是一些典型例子:

  • 单位时间内到达服务柜台(如银行、超市)的顾客数量
  • 一天内网站接收到的访问请求数量
  • 一平方米内纺织品的瑕疵点数
  • 一定时间内接到的电话呼叫次数
  • 放射性物质在一定时间内衰变的原子数
  • 一本书中每页的印刷错误数量

Python中的泊松分布实现

在Python中,我们可以使用scipy.stats模块的poisson类来处理泊松分布相关的计算。

# 导入必要的库
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import poisson

# 设置参数λ (平均发生率)
lambda_ = 3

# 创建泊松分布对象
dist = poisson(lambda_)

# 计算概率质量函数(PMF)
k_values = np.arange(0, 11) # k从0到10
pmf_values = dist.pmf(k_values)

# 计算累积分布函数(CDF)
cdf_values = dist.cdf(k_values)

# 生成随机样本
samples = dist.rvs(size=1000)

# 计算期望和方差
mean, var = dist.stats(moments='mv')

# 打印结果
print(f"期望值: {mean:.2f}")
print(f"方差: {var:.2f}")
print(f"k=3的概率: {dist.pmf(3):.4f}")
print(f"k≤3的累积概率: {dist.cdf(3):.4f}")

泊松分布可视化

下面是一个交互式泊松分布可视化工具,您可以调整λ值查看分布变化:

泊松分布的实际应用案例

案例:呼叫中心来电分析

假设某呼叫中心平均每小时接到5个电话(λ=5)。我们想计算:

1. 下一小时接到恰好3个电话的概率

2. 下一小时接到不超过2个电话的概率

3. 下一小时至少接到7个电话的概率

from scipy.stats import poisson

lambda_ = 5 # 平均每小时5个电话
dist = poisson(lambda_)

# 计算恰好3个电话的概率
p_3 = dist.pmf(3)
print(f"恰好3个电话的概率: {p_3:.4f}")

# 计算不超过2个电话的概率
p_leq_2 = dist.cdf(2)
print(f"不超过2个电话的概率: {p_leq_2:.4f}")

# 计算至少7个电话的概率 (1 - 累积到6的概率)
p_geq_7 = 1 - dist.cdf(6)
print(f"至少7个电话的概率: {p_geq_7:.4f}")