Pandas进阶

1、数据转换

1、apply,applymap应用

apply对DataFrame中的某一Series进行操作,上例中将Python中的成绩统一加100,使用的是简单隐式函数。

applymap是DataFrame中专有的,可以同时计算DataFrame中的每一个元素。

applymap可以同时将DataFrame中的所有数据进行操作。

2、transform使用

1、对一列执行一种操作

 2、对一列执行多种操作

 3、对多列执行不同操作

 3、重排随机抽样哑变量

 numpy中的方法permutation用于随机排列十个变量,然后将其赋值为行索引,按照随机排列的索引输出。

 哑变量,是独热编码,1表示有,0表示没有。示例中,0,1索引有b,所以b在0,1索引下显示为1。

2、数据重塑

.T转置。

 多层索引pd.MultiIndex.from_product

 多层列索引。

 行索引转为列索引,默认最里层调整。

 列索引转变行索引

 多层索引运算。

计算个人期中期末的总分数

 计算各科,期中期末的平均分

 4、数学和统计方法

1、简单统计指标

 统计各科60分以下的,60分一下为空数据标记出来。

 统计非空数据,也就是及格人数。

 统计中位数。

 统计最高分。

 索引标签,获得最大值,最小值位置。

 5、数据排序

 当前行索引是一个乱序,根据索引列名排序

 

 根据python的属性来排序。

 先根据Python排序,后根据Keras排序

 6、分箱操作

指定宽度分箱,将成绩划分为4个等级

 之前学过的transform和map,apply也有同样功能。

等频分箱

 6、分组聚合

计算男女各科成绩平均分

 计算男女个数

 计算男女在各班的人数

 获取每个班,男生女生最高分

 分组聚合agg

通过agg,分类后进行多种统计汇总。

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值