简单数据的统计分析
随机变量的概率分布对现实世界的建模和分析发挥这重要作用。有时,理论分布于收集到的某过程的历史数据十分贴近。有时,可以先对某过程的基本特性做先验性判断,然后不需要收集数据就可以选出合适的理论分布。在这两种情况下,均可用理论分布来回答显示种所遇到的问题,也可以从分布中生成一些随机数来模拟现实的行为。
一、随机变量及分布
1.均匀分布
这里‘均匀’是指随机点落在 区间(a,b)内任一点的机会是均等的,从而在相等的小区间上的概率相等,在任一区间(a,b)的,随机变量X的概率密度函数为一个常数。
y=P(x)=1/(b-a) (a<x<b)
均匀分布是随机抽样和随机模拟的基础,可用randint()和uniform()函数产生均匀随机数。
1.1整数随机数
1.2实数随机数
1.3整数随机数列
1.4 实数随机数列
2.正态分布
2.1正态分布函数
正态分布是统计分析的最主要分布。正态分布是古典统计学的核心,它有两个参数:位置参数均值μ,尺度参数标σ。正态分布的图形如倒立的钟,且分布对称。现实生活中,很多变量是服从正态分布的,如人的身高、体重和智商IQ。