写的时候也从互联网找了一些资料,参考链接放在文章中间了。
一些稀碎的东西:
卡方分布的n是用来查表的关键要素。
variance:方差
standard deviation:标准差
本文其实重点是用样本推断整体这部分内容的一个简单引子,对用样本推断整体做了一些知识的铺垫和通俗化的解释。对Chapter 2 Extra Slides PPT中的内容做了一部分补充,比如:
中心极限定理的通俗解释
大多数情况下,总体为什么可以假设服从正态分布的原因或猜想
后面还有随笔2/3/…,以便把这部分内容做一个系统的梳理和注解。内容将会包括,假设检验,用t分布预测事件发生的概率等。
正文:
由于这些变量都是独立同分布的,所以Xi的方差就和X的方差一样,平均值就和X的平均值一样,所以直接就可以写出来带有mu和theta的结果。样本平均值求出来和整体平均值一致,所以就说它没有系统误差,就是无偏估计(unbiased estimation);方差算出来和系统方差是有一个除以n的系统误差,所以就是有偏估计。
然而,抽样终究是抽样,并不能真正代表整体,计算出的特征值(方差和平均值)还是随机的,每抽一次样加入上一次的样本,所计算出的特征值可能和