什么是泊松分布?
泊松分布(Poisson Distribution)是一种离散概率分布,用于描述在固定时间或空间间隔内随机事件发生的次数。它由法国数学家西莫恩·德尼·泊松在1837年提出,是概率论中最重要的分布之一。
泊松分布的概率质量函数(PMF)
泊松分布的概率质量函数定义为:
$$P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!}$$
其中:
- \(k\) 是事件发生的次数 (k = 0, 1, 2, ...)
- \(\lambda\) 是单位时间(或单位面积)内事件发生的平均次数
- \(e\) 是自然对数的底数 (约等于2.71828)
泊松分布的性质
期望和方差
泊松分布的期望值(均值)和方差都等于参数 \(\lambda\):
$$E(X) = \lambda$$
$$Var(X) = \lambda$$
无记忆性
泊松过程具有无记忆性,即未来事件发生的概率与过去事件无关。
事件独立性
在不相交的时间区间内,事件发生的次数是相互独立的。
稀有事件
泊松分布适用于描述稀有事件,即事件发生的概率很小而试验次数很大时。
泊松分布的应用场景
泊松分布在现实生活中有广泛的应用,以下是一些典型例子:
- 单位时间内到达服务柜台(如银行、超市)的顾客数量
- 一天内网站接收到的访问请求数量
- 一平方米内纺织品的瑕疵点数
- 一定时间内接到的电话呼叫次数
- 放射性物质在一定时间内衰变的原子数
- 一本书中每页的印刷错误数量
Python中的泊松分布实现
在Python中,我们可以使用scipy.stats
模块的poisson
类来处理泊松分布相关的计算。
# 导入必要的库
import numpy as np
import matplotlib.pyplot as plt
from scipy.stats import poisson
# 设置参数λ (平均发生率)
lambda_ = 3
# 创建泊松分布对象
dist = poisson(lambda_)
# 计算概率质量函数(PMF)
k_values = np.arange(0, 11) # k从0到10
pmf_values = dist.pmf(k_values)
# 计算累积分布函数(CDF)
cdf_values = dist.cdf(k_values)
# 生成随机样本
samples = dist.rvs(size=1000)
# 计算期望和方差
mean, var = dist.stats(moments='mv')
# 打印结果
print(f"期望值: {mean:.2f}")
print(f"方差: {var:.2f}")
print(f"k=3的概率: {dist.pmf(3):.4f}")
print(f"k≤3的累积概率: {dist.cdf(3):.4f}")
泊松分布可视化
下面是一个交互式泊松分布可视化工具,您可以调整λ值查看分布变化:
泊松分布的实际应用案例
案例:呼叫中心来电分析
假设某呼叫中心平均每小时接到5个电话(λ=5)。我们想计算:
1. 下一小时接到恰好3个电话的概率
2. 下一小时接到不超过2个电话的概率
3. 下一小时至少接到7个电话的概率
from scipy.stats import poisson
lambda_ = 5 # 平均每小时5个电话
dist = poisson(lambda_)
# 计算恰好3个电话的概率
p_3 = dist.pmf(3)
print(f"恰好3个电话的概率: {p_3:.4f}")
# 计算不超过2个电话的概率
p_leq_2 = dist.cdf(2)
print(f"不超过2个电话的概率: {p_leq_2:.4f}")
# 计算至少7个电话的概率 (1 - 累积到6的概率)
p_geq_7 = 1 - dist.cdf(6)
print(f"至少7个电话的概率: {p_geq_7:.4f}")
发表评论