概率分布
概念:
主要用以表述随机变量取值的概率规律。为了使用的方便,根据随机变量所属类型的不同,概率分布取不同的表现形式。
分类:
离散数据:数据由一个个单独的数值组成,其中的每一个数值都有相应概率。(伯努利分布、二项分布、几何分布、泊松分布)
连续数据:数据涵盖的是一个范围,这个范围内的任何一个数值都有可能成为事件的结果。(正态分布、幂律分布)
安装python的科学计算包scipy
在python的科学计算包scipy的stats模块计算出常见概率分布的概率值,并用matplotlib包进行绘图。
在notebook环境下安装科学计算包scipy。如果已安装忽略下面安装步骤。
安装步骤:
1)打开终端Anaconda Prompt
2)在conda中运行以下命令:conda install scipy
如果存在多个python环境,先进入想要的环境再安装,比如我自己设置了py2和py3两个环境,先在conda中进入python环境:activate py3,再按上面步骤2执行
如果还没有安装numpy包和matplotlib包,也按上述命令安装这些包
离散概率分布——1.伯努利分布
# 案例:玩抛硬币的游戏,只抛1次硬币,成功抛出正面朝上记录为1,反面朝上即抛硬币失败记录为0
# 导入包
import numpy as np
import matplotlib.pyplot as plt
# 统计计算包的统计模块
from scipy import stats
# 解决jupyter 中文问题
from pylab import mpl
mpl.rcParams['font.sans-serif'] = ['SimHei']
'''
第1步,定义随机变量:1次抛硬币
正面朝上记录为1,反面朝上记录为0
'''
# arange用于生成一个等差数组,arange([start, ]stop, [step, ]
X1 = np.arange(0,2,1)
X1
'''
第2步,求对应分布的概率:概率质量函数(PMF)
返回一个列表,