Pandas库中data.describe()函数有什么作用

Pandas库中data.describe()函数有什么作用

data.describe() 函数是 Pandas 库中用于生成描述性统计信息的方法。它提供了关于数值列的统计信息,包括均值、标准差、最小值、25%,50%,75% 分位数以及最大值。对于非数值列,describe() 返回的统计信息包括计数、唯一值的数量、出现最多的值和它的频率。

以下是一个简单的示例:

import pandas as pd

# 假设有一个名为data的DataFrame
data = pd.DataFrame({
    'Age': [25, 30, 35, 40, 45],
    'Salary': [50000, 60000, 75000, 90000, 80000],
    'Experience': [2, 5, 8, 10, 6]
})

# 生成描述性统计信息
print(data.describe())

输出可能类似于:

            Age        Salary  Experience
count   5.000000      5.000000     5.000000
mean   35.000000  73000.000000     6.200000
std     7.071068  14696.556456     2.949576
min    25.000000  50000.000000     2.000000
25%    30.000000  60000.000000     5.000000
50%    35.000000  75000.000000     6.000000
75%    40.000000  80000.000000     8.000000
max    45.000000  90000.000000    10.000000

这里,对于每个数值列,count 是非缺失值的数量,mean 是均值,std 是标准差,min 是最小值,25%、50%、75% 分别是对应的百分位数,max 是最大值。对于非数值列,count 是非缺失值的数量,unique 是唯一值的数量,top 是出现频率最高的值,freq 是出现频率。这些统计信息对于初步了解数据分布和特征之间的关系非常有帮助。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值