数据散布的度量

本文详细探讨了数据散布的各种度量,包括集中趋势(平均数、中位数、众数)、偏度、峰度、标准差、极差、四分位数和变异系数等。这些度量用于评估数据的离散程度、对称性和分布形态,帮助理解数据的集中位置和分散情况。
摘要由CSDN通过智能技术生成

http://blog.csdn.net/pipisorry/article/details/72820982

考察评估数值数据散布或发散的度量。这些度量包括极差、分位数、四分位数、百分位数和四分位数极差。五数概括可以用盒图显示,它对于识别离群点是有用的。方差和标准差也可以指出数据分布的散布。

集中趋势

集中趋势(central tendency)在统计学中是指一组数据向某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。集中趋势测度就是寻找数据水平的代表值或中心值,低层数据的集中趋势测度值适用于高层次的测量数据,能够揭示总体中众多个观察值所围绕与集中的中心,反之,高层次数据的集中趋势测度值并不适用于低层次的测量数据。

在统计学中,集中趋势(central tendency)或中央趋势,在口语上也经常被称为平均,表示一个概率分布的中间值。最常见的几种集中趋势包括算数平均数、中位数及众数。

一维资料的集中趋势可能有以下数种统计方法。

算数平均数 
观测值的总和除以观测值的个数,即 x 1 + x 2 + x 3 … + x n n {\displaystyle {\tfrac {x_{1}+x_{2}+x_{3}\ldots +x_{n}}{n}}} {\displaystyle {\tfrac {x_{1}+x_{2}+x_{3}\ldots +x_{n}}{n}}}。常简称为平均数,也往往是背后概率分布的期望值之不偏估计。
中位数 
将所有观测值按大小排序后在顺序上居中的数值。
众数
出现最多次的观测值。
几何平均数 
观测值的乘积之观测值个数方根,即 ( x 1 × x 2 × x 3 … × x n ) 1 n {\displaystyle (x_{1}\times x_{2}\times x_{3}\ldots \times x_{n})^{\frac {1}{n}}} {\displaystyle (x_{1}\times x_{2}\times x_{3}\ldots \times x_{n})^{\frac {1}{n}}}
调和平均数 
观测值个数除以观测值倒数的总和,即 n 1 x 1 + 1 x 2 + . . . + 1 x n {\displaystyle {\frac {n}{ {\frac {1}{x_{1}}}+{\frac {1}{x_{2}}}+...+{\frac {1}{x_{n}}}}}} {\displaystyle {\frac {n}{​{\frac {1}{x_{1}}}+{\frac {1}{x_{2}}}+...+{\frac {1}{x_{n}}}}}}
加权平均数 
考虑不同群资料贡献程度不同时的算数平均数
截尾平均数(英语:Truncated_mean)( truncated mean) 
忽略特定比例或特定数值之外的极端值后所得的平均数。例如, 四分平均数(英语:Interquartile_mean)( interquartile mean)正是忽略25%前及75%后的资料后所得的算数平均数。
全距中点(英语:Midrange)( midrange) 
最大值与最小值的算数平均数,即 min ( x ) + max ( x ) 2 {\displaystyle {\frac {\min(x)+\max(x)}{2}}} {\displaystyle {\frac {\min(x)+\max(x)}{2}}}
中枢纽(英语:Midhinge)( midhinge) 
第一四分位数与第三四分位数的算数平均数,即 Q 1 + Q 3 2 {\displaystyle {\frac {Q_{1}+Q_{3}}{2}}} {\displaystyle {\frac {Q_{1}+Q_{3}}{2}}}
三均值(英语:Trimean)( trimean) 
考虑三个四分位数的加权平均数,即 Q 1 + 2 Q 2 + Q 3 4 {\displaystyle {\frac {Q_{1}+2Q_{2}+Q_{3}}{4}}} {\displaystyle {\frac {Q_{1}+2Q_{2}+Q_{3}}{4}}}
极端值调整平均数(英语:Winsorized_mean)( winsorized mean) 
以最接近的观测值取代特定比例的极端值后取得的算数平均数。举例来说,考虑10个观测值(由小到大排列为 x 1 {\displaystyle x_{1}} x_1至 x 10 {\displaystyle x_{10}} {\displaystyle x_{10}})的情况下,10%的极端值调整平均数为
x 2 + x 2 ⏞ + x 3 + x 4 + x 5 + x 6 + x 7 + x 8 + x 9 + x 9 ⏞ 10 {\displaystyle {\frac {\overbrace {x_{2}+x_{2}} +x_{3}+x_{4}+x_{5}+x_{6}+x_{7}+x_{8}+\overbrace {x_{9}+x_{9}} }{10}}}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值