统计分析——描述统计之数据水平描述

博客介绍了描述数据水平的统计量,包括平均数、分位数和众数。内容涉及简单平均数与加权平均数的计算,以及在R和Python中实现这些统计量的方法。平均数作为集中趋势的度量,分位数如中位数和四分位数提供数据分布高低的信息,而众数则标识频数最多的数值。在R和Python中,对于分位数的计算存在多种方式,而众数的求解需要自定义函数。
摘要由CSDN通过智能技术生成

一组样本数据的数值特征一般来说可以从三个方面来描述:

  1. 数据的水平(也可以称之为集中趋势或位置度量),反映数据的数值大小

  2. 数据的差异,反映数据间的离散程度

  3. 数据的分布形状,反映数据分布的偏度峰度

描述水平的统计量

数据水平是指数值大小,描述数据水平的统计量有平均数分位数众数,同时这几个统计量也可以用来描述数据的集中趋势度

平均数

**简单平均数(simple mean)**的公式:

x ˉ = x 1 + x 2 + x 3 + . . . + x n n = ∑ i = 1 n x i n \bar{x} = \frac{x_{1}+x_{2}+x_{3}+...+x_{n}}{n} = \frac{\sum_{i=1}^{n}x_{i}}{n} xˉ=nx1+x2+x3+...+xn=ni=1nxi

加权平均数(weighted mean):如果样本被分为K组,每组的组中值(组上限与下限的平均数)为m1,m2,…,mk表示各组的频数用f1,f2,…,fk表示,则样本平均数的计算公式为:
x ˉ = m 1 f 1 + m 2 f 2 + m 3 f 3 + . . . + m k f k f 1 + f 2 + f 3

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值