从零开始利用Excel与Python进行数据分析
上QQ阅读APP看书,第一时间看更新

2.2.2
离散型随机变量分布

离散型随机变量取值为有限个,如掷骰子所有可能的结果为6个。下面介绍常见的离散型随机变量分布,这些分布往往能在现实中找到对应的场景。

1.二项分布

二项分布用于描述只有两个可能结果的随机事件,相关说明如表2-8所示。

表2-8 二项分布

现实中有很多场景符合二项分布,如判断工厂零件质量是否合格,用户是否会点击网站上的广告链接等。计算这些场景中的概率、期望、方差可以为生产运营提供数据支持。

下面是一个二项分布计算的例子。假设某药物经过实验测试后发现有效率为90%,现对8位患者使用,计算期望与至少6人被治愈的概率。

2.泊松分布

泊松分布用于描述单位时间或空间内随机事件发生的次数,相关说明如表2-9所示。

表2-9 泊松分布

日常生活中,很多事件都有固定频率,如某医院平均每小时出生3个婴儿、某网站平均每分钟有2次访问,这些事件都可以通过泊松分布计算。

图2-3所示为部分泊松分布概率值。第一行为λ值,第一列为变量的值。如要确定λ=9时变量值为10的概率,只需在表中查找交叉单元格中的概率值。

图2-3 泊松分布概率表

3.几何分布

几何分布用于描述在n次伯努利实验中,实验x次才获得第一次成功的概率,相关说明如表2-10所示。

表2-10 几何分布

日常生活中有很多“第一次成功”的场景。例如,篮球运动员进行三分球投篮,完成第一次命中需要投篮几次。

下面是一个泊松分布计算的例子。某篮球运动员的罚球命中率为85%,计算三罚不中的概率。