pandas中describe函数详解

describe()函数可以查看DataFrame中数据的基本情况

参数:
  • include:包含哪类数据。默认只包含连续值,不包含离散值;include = ‘all’ 设置全部类型
    在这里插入图片描述
  • percentiles:设置输出的百分位数,默认为[.25,.50,.75],返回第25,50,75百分位数
    在这里插入图片描述
原数据:
data = pd.read_table(path)
data.head()

在这里插入图片描述

使用describe函数之后:
data.describe(include = 'all')

在这里插入图片描述

分析:
对连续值来说:
  • count:每一列非空值的数量
  • mean: 每一列的平均值
  • std:每一列的标准差
  • min:最小值
  • 25%:25%分位数,排序之后排在25%位置的数
  • 50%:50%分位数
  • 75%:75%分位数
  • max:最大值
对离散值来说特有的:
  • unique:不重复的离散值数目,去重之后的个数
  • top: 出现次数最多的离散值
  • freq: 上述的top出现的次数
也可以对单列进行分析
data['mass'].describe()

在这里插入图片描述

data['fruit_name'].describe()

在这里插入图片描述

  • 16
    点赞
  • 97
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值