新增内容日志
20210712
大数定律和中心极限定理
统计学分析方法
01 | 描述统计
描述统计是通过数据、可视化图表的形式,对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。
1.集中趋势分析
利用平均数、中数、众数等统计指标来表示数据的集中趋势。
例如被试的平均成绩多少?是正偏分布还是负偏分布?
2.离中趋势分析
靠全距、四分差、平均差、方差(协方差:用来度量两个随机变量关系的统计量)、标准差等统计指标来研究数据的离中趋势。
比如用两个班级的四分差或百分点来比较,就可以得知哪个班级内的成绩分布更分散
3.相关分析
探讨数据之间是否具有统计学上的关联性。
可以是单方面相关,也可以说互相相关。
4.推论统计
5.大数定律和中心极限定理
①大数定律
概率论历史上第一个极限定理属于伯努利,也被称之为“大数定律”。在随机事件的大量重复出现中,往往呈现几乎必然的规律,这个规律就是大数定律。
例如抛硬币,出现正反面的概率不尽相同。但是当抛的次数到大一定数量时,两种结果的概率往往各自趋向于二分之一。同样的,我们要统计一个地区的生育率,当统计样本达到一定数量时,概率基本会稳定在一个区间。
②中心极限定理
当样本量越来越大时,样本均值会趋向于正态分布(钟形曲线)。正态分布有两个量来描述,一个是均值,一个是方差。中心极限定理对样本分布不做要求(离散,连续,非正态分布都可以)。
许多统计要求样本是正态分布的,此时中心极限定理可以承担桥梁的作用,实现数据样本的正态分布,满足统计检验方法的先决条件。
比如要用统计检验的方法,比较一个地区男人跟女人秃头的平均年龄是否有差异,但是当样本量较小的时候,样本是离散分布的。但通过中心极限定理,当样本量达到一个阈值,那么样本就可以实现正态分布。
02 | 常见数值
1.平均值
2.加权平均值
我们常用平均数表示一组数据的‘平均水平’。把在一组数据里,一个数据出现的次数称为权。
学校算期末成绩,期中考试占30%,期末考试占50%,作业占20%,