描述性统计分析

描述性统计分析是数据分析的初步阶段,涉及数据的集中趋势(均值、中位数、众数)、离散程度(极差、方差、标准差)、分布形状(偏度、峰度)等指标。均值易受极值影响,中位数不受极值影响,众数反映频数分布。此外,还包括极差、四分位数、方差和标准差等,它们提供了对数据集特性的洞察,为进一步分析奠定基础。
摘要由CSDN通过智能技术生成

本小节介绍什么是描述性统计分析,以及常用的指标

一、什么是描述统计分析(Descriptive Analysis)

概念:使用几个关键数据来描述整体的情况

描述性数据分析属于比较初级的数据分析,常见的分析方法包括对比分析法、平均分析法、交叉分析法等。描述性统计分析要对调查总体所有变量的有关数据做统计性描述,主要包括数据的频数分析、数据的集中趋势分析、数据离散程度分析、数据的分布、以及一些基本的统计图形。

Excel里的分析工具库里的数据分析可以实现描述性统计分析的功能。

描述性统计分析即是对数据源最初的认知,包括数据的集中趋势、分散程度以及频数分布等,了解了这些后才能去做进一步的分析。

二、常用指标

均值、中位数、众数体现了数据的集中趋势。

极差、方差、标准差体现了数据的离散程度。

偏度、峰度体现了数据的分布形状。

1、均值。均值容易受极值的影响,当数据集中出现极值时,所得到的的均值结果将会出现较大的偏差。

2、中位数:数据按照从小到大的顺序排列时,最中间的数据即为中位数。当数据个数为奇数时,中位数即最中间的数,如果有N个数,则中间数的位置为(N+1)/2;当数据个数为偶数时,中位数为中间两个数的平均值,中间位置的算法是(N+1)/2。中位数不受极值影响,因此对极值缺乏敏感性。

3、众数:数据中出现次数最多的数字,即频数最大的数值。众数可能不止一个,众数不能能用于数值型数据,还可用于非数值型数据,不受极值影响。

4、极差

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

进击的可乐!

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值