python数据处理----pandas计算常用统计值和排序

计算常用统计值

describe( )方法:

college.describe()

# count: 样本数据的大小
# mean: 数据的平均值
# std: 数据的标准差
# min: 数据的最小值
# 25%: 1/4位数,数据在25%时的值
# 50%: 中位数
# 75%: 3/4位数
# max: 数据的最大值

在这里插入图片描述

定义describe的include参数来决定统计什么类型:

# 统计字符串类型的数据
college.describe(include=object).T
# count: 非空值数量
# unique: 唯一值数量
# top: 频数最高的数量
# freq: 最高频数

在这里插入图片描述

# 统计所有类型的数据
college.describe(include='all').T

在这里插入图片描述

info( )方法:

在这里插入图片描述


常用排序方法

nlargest()方法,从大到小
从大到小排序选出100条数据:

# 从大到小排序,参数1为选出多少个,参数2为依据xx字段排序
new_movie.nlargest(100,'imdb_score')

在这里插入图片描述

nsmallest()方法,从小到大
继续调用从小到大排序选出5条数据:

# 从小到大排序,参数1为选出多少个,参数2为依据xx字段排序
new_movie.nlargest(100,'imdb_score').nsmallest(5,'budget')

在这里插入图片描述

sort_values()根据值排序:

参数1为以xx字段排序,ascending为升序,当ascending为False时是降序,默认也是降序

movie3.sort_values('title_year',ascending=False)

在这里插入图片描述

传入列表,对年份排序之后再对评分进行排序:

movie3.sort_values(['title_year','imdb_score'],ascending=False)

在这里插入图片描述

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值