统计学第一次学习
样本与总体:
均值:mean 衡量集中趋势的方法。
中位数:median 考虑集中趋势的另一种方式。
众数:mode 也就是出现频率最高的数字。
极差:range数字越大表示数据之间越分散、越小表示越紧密,用来衡量集中趋势。
中程数:midrange 衡量集中趋势的另一种方式。
随机变量:
随机变量通常为函数,用于量化随机过程,通常用X,Y,Z等表示,普通变量为小写的x,y,z表示。随机变量分为离散型和连续型。
二项分布:
二项分布就是伯努利实验重复N次。每次实验结果都有两个可能,并且两个结果相互独立,与实验的次数无关,也就是实验的事件概率每次都保持独立不变。
期望:
随机变量的期望值即为总体的均值。当总体样本无限多,均值计算很难得到结果,提出期望E(X)计算均值的方法,利用频率作为权重计算所有结果的加权平均。
二项分布的期望值:
二项分布X~B(n,p),期望值E(X)=np。
大数定律:
大数定律描述了随机现象最根本的一个性质:平均结果的稳定性。大数定律告诉我们:对于独立同分布的随机序列,只要总体均值(随机变量期望)存在,则随着样本数的增加,样本均值会收敛到总体均值。注意样本数的足够性,概率是频率的一个极限值,这样可以避免赌徒谬误。
正态分布:
二项分布,泊松分布都是离散分布,而正态分布是连续分布。二项分布和泊松分布都可以转化为正态分布。正态曲线下,横轴区间(μ-σ,μ+σ)内的面积为68.268949%。横轴区间(μ-1.96σ,μ+1.96σ)内的面积为95.449974%。横轴区间(μ-2.58σ,μ+2.58σ)内的面积为99.730020%。
可汗学院:统计学第一次学习
最新推荐文章于 2021-08-26 17:25:16 发布