统计学基本知识
总体:问题涉及的所有数据
样本:总体的部分数据
统计即用样本估计总体
期望值:一组数据的平均情况
概率分布:离散数据的分布
概率密度函数:连续数据的分布
总体方差:无偏方差,真实的方差
样本方差:有偏方差,样本的方差,用来评估总体方差
标准差:方差开根号
简单分布
二项分布
多次伯努利实验(抛硬币)
假设实验成功的概率为p
E(x) = np
D(x) = np(1-p)
泊松分布
单位时间内随机事件发生的次数。泊松分布跟时间的起点无关,只跟时间的长度有关,这被称为泊松分布的无记忆性。
最典型的一个例子是一辆公交车到达一个车站的次数满足泊松分布,平均一辆公交车达到这个站点是10分钟,已知一个乘客等公交等了5分钟,那么他还需要等待10分钟才能等到公交车。(当然现实的公交车到达车站不是满足泊松分布)
E(x) =
D(x) =
正态分布
广泛存在于自然界中的分布,又称钟型曲线。
基本定理
大数定律
随着实验次数的增多,随机变量的算术平均值向期望值收敛。
经典例子,随着抛硬币的次数增长,硬币朝上的频率稳定在1/2(概率)。
致谢:
khan Academy https://www.khanacademy.org/math/ap-statistics