统计学中有一些很重要的度量方式,如同「概率论」中用期望、方差评价分布的离散情况一样;在统计学里也使用了相似的概念,比如说「均值」、「方差」,另外还多了一个「样本炬」,现在让我们来看看这些具体的定义吧。
样本均值
X ˉ = 1 n ∑ i = 1 n x i \bar{X} = \frac{1}{n} \sum_{i=1}^{n} x_i Xˉ=n1i=1∑nxi
这个没什么好特别说明的,就是把「样本个体」的值相加后除以「样本总数」得到一个平均值。
样本方差
S 2 = D ( X ) = 1 n − 1 ∑ i = 1 n ( x i − μ ) 2 S^2 = D(X) = \frac{1}{n-1} \sum_{i=1}^{n} (x_i - \mu)^2 S2=D(X)=n−11i=1∑n(xi−μ)2
样本方差,和总体方差 1 n ∑ i = 1 n ( x i − μ ) 2 \frac{1}{n} \sum_{i=1}^{n} (x_i - \mu)^2 n1∑i=1n(xi−μ)2 同样是对离散程度的估计,但是两者之间存在着一定的区别。
由于统计学引入了 自由度 的概念,所以通常情况下我们计算样本方差时会把 n n n 调整为 n − 1 n-1 n−1。因为对于两两独立的样本来说,评价它们的离散情况,我们最少需要两个样本参与计算,这就导致我们不能使用 n n n 来作为方差均值的分母,而只能用 n − 1 n-1 n−1。
样本矩 (moments)
设 x 1 , ⋯ x n x_1, \cdots x_n x1,⋯xn 为从总体F中抽取的样本,则称
a k = 1 n ∑ i = 1 n x i k , k = 1 , 2 , ⋯ a_k = \frac{1}{n} \sum_{i=1}^{n} x_i^k, k = 1, 2, \cdots ak=n1i=1∑nxik,k=1,2,⋯
为样本k阶原点矩,如果 k = 1 k =1 k=1 时, a 1 = X ˉ a_1 = \bar{X} a1=Xˉ 即样本均值,称
m k = 1 n ∑ i = 1 n ( x i − X ˉ ) k , k = 2 , 3 , ⋯ m_k = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{X})^k, k = 2, 3, \cdots mk=n1i=1∑n(xi−Xˉ)k,k=2,3,⋯
为样本k阶中心矩。
对于什么是「样本矩 」,中文的翻译其实真让人摸不着头脑。「矩」引用自物理学,数学上对于「矩」的比较正式的定义如下:
在数学中,函数的矩是与函数图形形状相关的定量度量。
如果函数表示质量,则一阶矩为质心,二阶矩为转动惯量。
如果函数是概率分布,那么第一个矩是期望值,第二个中心矩是方差;第三个标准化矩是偏度;第四个标准化矩是峰度。
数学概念与物理学中的矩概念密切相关。
而「矩」在物理上原本的定义如下:
在物理学中,矩是表示距离和物理量乘积的物理量(即向量叉乘)。由其定义,矩通常需要一个参考点(基点或参考系)来定义距离。如力和参考点距离乘积得到的力矩(或扭矩),原则上任何物理量和距离相乘都会产生力矩,质量,电荷分布等。