样本(Sample):从总体中选取的一部分。样本取样的时候要随机抽取,样本均值一般用 表示
总体(Population):研究对象的整个群体。总体均值一般用 μ 表示。
总体方差:每个样本值与全体样本值的平均数之差的平方值的平均数。公式为:
样本方差:样本的方差,因为样本均值可能与总体均值相差很大,所以公式为
标准差:总体各单位标准值与其平均数离差平方的算术平均数的平方根,标准差是一组数据平均值分散程度的一种度量。一个较大的标准差,代表大部分数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。
二项分布:n重伯努利试验成功次数的离散概率分布。伯努利实验是一种只有两种实验结果的单次随机实验。二项分布的前提是每次实验都相互独立。公式为:
泊松分布:如果某事件以固定强度λ,随机且独立地出现,该事件在单位时间内出现的次数可以看成是服从泊松分布。泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生次数。 期望和方差均为λ。公式如上图所示。
正态分布:又叫高斯分布,若随机变量X服从一个数学期望为μ、方差为σ^2的正态分布,记为N(μ,σ^2)。正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ = 0,σ = 1时的正态分布是标准正态分布。其概率密度函数如上图所示。
大数定律:在实验次数足够多时,样本均值趋近于其分布的期望。举个例子,投硬币。一枚硬币被抛出后有50%的可能为正面或者背面,在小样本的情况下,随机抛硬币的结果可能并不明显或者说结果没有规律,不稳定等等等等,10次里可能有4次正面6次背面,也可能是7次正面3次背面,这很正常。但是随着我们抛硬币的次数的增多,正面和反面出现次数就会越来越接近于相同。大数定律不关心前面有限次实验的结果,因为后面还有无数次均值趋近于期望的实验,总体是趋近于期望的。