Deepgener生信教程《生信中的统计基础》——抽样分布(1)
教程概述
作为本系列教程的第一次课,先说一下本系列教程的大致内容和对读者的一些要求。本系列课程以统计学的核心——“用样本推断总体”为主线,以抽样分布,统计推断,方差分析,回归分析为主要内容了解统计学的生信应用。为了减少读者的阅读困难,读者可先回顾一下概率论以及概率分布相关知识。每次教程我都会对该次内容做一个总的介绍,在教程中如果有何纰漏和错误,欢迎广大学者发邮件进行批评和指正,谢谢大家。(948740615@qq.com)
介绍
统计学的核心是用样本推断总体,用样本的特点去概括总体的特点。抽样分布研究的就是已知总体特点进而分析样本的特点,从而有利于后面利用样本的特点去分析总体的特点。本次课程以一个样本为例介绍抽样分布的相关内容。
1.中心极限定理
中心极限定理是统计学和核心定理,是研究随机变量和极限分布的一类定理。我们需要重点关注的中心极限定理中的大数定理:只要实验次数足够多,样本均值就会趋近于母体的期望(证明略)。
2.抽样分布的概念
通常我们用均值、方差、标准差去描述样本的特征时,将这些指标称为样本统计量;描述总体时就叫做总体参数。值得注意的是,样本统计量是样本的函数,