数据的描述性统计

本文详细介绍了数据集中趋势的度量,包括中位数、众数、平均数的概念和计算方法,并提供了Python代码示例。此外,还探讨了分位数、四分位数、全距、标准差、离散系数、偏态系数和峰度等统计概念及其计算公式,帮助理解数据的离中趋势和分布形状。
摘要由CSDN通过智能技术生成

# 数据集中趋势描述
数据集中趋势的度量:平均数、中位数、众数
## 中位数
**概念**:样本,种群或者概率分布中的一个数值,其可将数值集合划分为相等的上下两部分
**求中位数一共有三步:**
    
   * 从小到大顺序排列数值
   * 如果数值是奇数个,则中位数位于中间的数值,如果有n个数值,则中间数的位置是(n+1)/2
   * 如果数值为偶数个,则中位数是中间两个数值相加除以2 , 中间位置的算法是(n+1)/2 ,n/2
**公式:**
    ![c4d0a81a77ab9d4cddc85e46e2166e3f.png](en-resource://database/434:1)
**代码:**
```
import numpy as np
#中位数
np.median(nums)
```


## 众数
**概念**:众数为数值中出现最多的数字,众数不止一个,可以指定具有最高频数的数组值
**求众数的三步:**

   * 把数据中不同类别的数据取出
   * 计算不同数值出现的频次
   * 挑出出现频次最高的一个或几个数值
   
**代码:** 
```
# 方法1
import numpy as np
 
counts = np.bincount(nums)
#返回众数
np.argmax(counts)

```

## 平均数
**概念:** 所有数据加起来,再除以这些数据的个数
**求平均数:** 
    
   * 将所有数值相加除以数值的个数
**公式:**
![213055f6eba694f38af74f344d9280f6.png](en-resource://database/436:1)

**代码:**
```
import numpy as np
 
#均值
np.mean(nums)

```

## 分位数
**概念:**  分位数也称分位点,指用分割点将一个随机变量的概率分布分为几个相同概率的连续空间

##### 四分位数
   
 概念&#x

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值