n-1的使用称为贝塞尔校正(Bessel's correction),也用于样本协方差和样本标准偏差(方差平方根)。 平方根是一个凹函数,因此引入负偏差(由Jensen不等式),这取决于分布,因此校正样本标准偏差(使用贝塞尔校正)有偏差。
用python随机生成一个一百万数据的总体,然后进行1000次抽样,每次抽50个数据。
1.先导入需要用到的包
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import random
#配置画布的大小
from IPython.core.pylabtools import figsize
2.随机生成一个一百万数据的总体,并进行1000次抽样,每次抽取50个数据。
3.方差计算与移动平均计算。python中var默认的是计算样本方差,即ddof=1,除(n-1);当ddof=0,才是除n。移动平均的计算是用expanding函数实现的。
4.对结果进行画图展示,可以发现除(n-1)的样本方差计算更贴近总体方差
下次再用公式推导一下。