数据分析之定量数据的描述统计

本文探讨了数据分析中的集中趋势和离中趋势度量。集中趋势通过均值、中位数和众数来衡量数据的一般水平,其中均值对极端值敏感,而中位数和众数则提供了不同角度的洞察。离中趋势则通过极差、标准差、变异系数和四分位数间距来评估数据的分散程度,这些指标帮助我们理解数据的波动范围和稳定性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

从集中趋势和离中趋势两个方面进行分析:

1、集中趋势度量

(1)均值

主要问题时对极端值比较敏感,因此可以使用截断均值来度量。

算术平均数:=mean()

几何平均数:=exp(mean(log()))

计算数据样本的指定阶中心距(R语言):moment(X,order),计算样本X的order阶的中心距。

(2)中位数

(3)众数

众数更适用于定性变量。众数不具有唯一性。

2、离中趋势度量

(1)极差

极差 = 最大值 - 最小值

极差的问题是忽略了位于最大值和最小值之间的数据是如何分布的。

(2)标准差

(3)变异系数

度量标准差相对于均值的离中趋势,用来比较两个或多个具有不同单位或不同波动幅度的数据集的离中趋势。

CV=\frac{s}{\bar{x}}

(4)四分位数间距

上四分位数{Q}_U与下四分位数

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值