统计-3 数据的描述:统计量

本文介绍了统计学中的数据描述方法,包括众数、中位数、均值、极差、标准差和标准误差的概念。强调了中位数对极端值不敏感,均值对值敏感,标准差作为衡量数据波动性的指标。同时提到了标准得分作为不同变量间比较的工具,以及如何理解标准得分的范围。
摘要由CSDN通过智能技术生成

统计-3, 数据描述:统计量

一个原始观察值组成的数据包括的全部的信息,而从全部的信息中直接看出点什么还挺不靠谱,很多规律信息都被随机性掩盖了;因此,可以用统计量来是数据集中简单化,然后必然的会丢失某些信息,不过这些信息大多时候并不是重点,得偿于失;

1.   平均数 之 众数

众数:一个变量出现次数最多的值;一般用来描述分类型的变量,比如性别、年龄区间;如果有两个值出现最多,那就有两个众数,称为二众数分布,比如一个半的身高,男生一个众数,女生一个众数;而这仅仅告诉我们那个值最多,多1个也是多,多100也是多,因此信息丢的多;


2.   平均数 之 中位数

中位数:排序后的中间位置的值,一半观察值比之小,一半观察值比之大;,既然能排序,那面对的变量肯定是实数;如果变量数据直方图分布是倾斜的,那中位数能给出分布的峰值位置;其对极端值不敏感,只对相对大小有关系,因此即优点又是缺点;


3.   平均数 之 均值:

均值:观察值和除以观察值个数;是一个变量值,代表观察值的中部,数据的重心,与之对比,中位数可称为数据的中心;中位数对位置敏感,均值对值敏感;如果存在极端值一般不用平均数,比如长尾倾斜分布一般用中位数,分布相对对称的用均值;可以将中位数和均值都算出来ÿ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值