分位数和箱线图

1.什么是分位数?
简单说就是指将一个随机变量的概率分布范围分为几个等份的数值点,常用的有中位数(即二分位数)、四分位数、百分位数等。
Q1-数据中有25%个数据都比它小,第一分位数
Q2-中位数
Q3-数据中有75%个数据都比它小,第三分位数
箱线图:
在这里插入图片描述
箱线图可以从侧面看出异常值和数据的分布情况,在上图数据比较集中在比较大的数。


用python 计算分位数:
怎么计算分位数:https://blog.csdn.net/juliarjuliar/article/details/81082934

import numpy as np
import pandas as pd

# array数据处理
a = np.array([7, 15, 36, 39, 40, 41, 20, 18])  # 不需要从小到大排序
# 方法一:用numpy中的percentile
median_data = np.median(a)  # 中位数
percent_data = np.percentile(a, 25)  # 25%分位数
print(median_data)
print(percent_data)

# 方法二:用pandas中的quantile
b = pd.DataFrame(a)  # 数据转化
median_data1_pd = b.median()  # 中位数
quant_data = b.quantile(0.25)  # 25%分位数
print(median_data1_pd)
print(quant_data)


# .csv文件处理
data = pd.read_csv('test_3class.csv')
# 1.quantile方法
quant_data = data['math'].quantile(0.25)
print("quant_data = ", quant_data)
# 2.percentile方法
percent_data = np.percentile(data['math'], 25)
print("percent_data = ", percent_data)

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值