总体方差(the variance of a population)
用来表述数据与均值之间的偏离程度。
σ2=====∑Ni=1(xi−μ)2N∑Ni=1(x2i−2xiμ+μ2)N(∑Ni=1x2i)−(∑Ni=12xiμ)+(Nμ2)N(∑Ni=1x2i)−2μ(Nμ)+(Nμ2)N(∑Ni=1x2iN)−μ2
其中,总体均值
μ=∑Ni=1xiN
样本方差(the variance of a sample)
s2=∑ni=1(xi−x¯)2n−1
其中,样本均值
x¯=∑ni=1xin
标准差(Standard Deviation)
标准差 σ 是表述数据与均值之间的偏离程度的另一个重要标志。它等于方差的平方根。
总体的标准差
σ=∑Ni=1(xi−μ)2N−−−−−−−−−−−−√
样本的标准差
s=∑ni=1(xi−x¯)2n−1−−−−−−−−−−−−√
随机变量(Random Variable)
随机变量是表示随机现象各种结果的变量。萨尔曼认为随机变量并不是传统意义上的变量,而是一种由随机过程映射到数值的过程。
分为两种:
- 连续随机变量
- 离散随机变量
概率密度函数(Probability Density Function)
概率密度函数也被称为概率分布函数。连续随机变量的概率密度函数是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。而随机变量的取值落在某个区域之内的概率则为概率密度函数在这个区域上的积分。
二项分布(Binomial Distribution)
在概率论和统计学中,二项分布是n个独立的是/非试验中成功的次数的离散概率分布,其中每次试验的成功概率为 p 。
一般地,如果随机变量
f(k;n,p)=Pr(K=k)=(nk)pk(1−p)n−k
对于 k=0,1,2,...,n ,其中
(nk)=n!k!(n−k)!
期望值 E(X)
在概率论和统计学中,一个离散性随机变量的期望值(或数学期望、或均值,亦简称期望,物理学中称为期待值)是试验中每次可能结果的概率乘以其结果的总和。
如果
X
是离散的随机变量,输出值为
E[X]=∑ipixi
二项分布的期望值
E[X]=n⋅p
其中 n 为随机试验次数,
【推导过程】
E[X]=====a=k-1,b=n-1=∑k=1nk⋅(nk)⋅pk(1−p)n−k∑k=1nk⋅n!k!(n−k)!⋅pk(1−p)n−k∑k=1nn⋅(n−1)!(k−1)!(n−k)!⋅p⋅pk−1(1−p)n−knp∑k=1n(n−1)!(k−1)!(n−k)!⋅pk−1(1−p)n−knp∑a=0bb!a!(b−a)!⋅pa(1−p)b−anp