python必知必会的数据处理知识2(pandas))

最新推荐文章于 2024-07-18 06:37:08 发布

little_miya

最新推荐文章于 2024-07-18 06:37:08 发布

阅读量2.4k

点赞数

分类专栏： python 文章标签： python 开发语言后端

本文链接：https://blog.csdn.net/allenhsu6/article/details/121949498

版权

13 篇文章 0 订阅

订阅专栏

本节重点是统计运算。通常用pandas做事情，涉及数值运算的少。

数值运算只对数值列起作用。

可以直接使用 +，也可以使用函数add()
DataFrame.add(other, axis='columns', fill_value=None)

其余的操作：-, ×, /, //,%, **
相应的函数形式：sub(), mul(), div(), floordiv(), mod(), pow()。
这几个操作和+ 以及add()完全相同。

此外，还有divmod()函数作为python的内建函数，支持对Series进行逐个元素操作。

d,r = divmod(s1, 2)

将s1用2做除法，商是d，余数是r

abs()
调用方法很简单：df.abs()
cumxxx()
累计运算，从开始到当前数据结束获取一个值。 xxx可以是 max， min, sum, prod(连乘)
DataFrame.cumxxx(axis='index')
其中axis可以使index或者columns
clip()
DataFrame.clip(lower=None, upper=None)
将数据裁剪到一定范围内
rank()
将数据排序，输出为对应值在排序中的序号
DataFrame.rank(axis=0, method='average', ascending=True, pct=False)
- axis：0（‘index’）-按列方向，1(‘columns’)-按行方向
- method：对于值相同的数怎么标记顺序，
  - ‘average’: 先排序，值相同的序号统一为平均序号
  - ‘min’: 先排序，值相同的序号统一为最小序号
  - ‘max’: 先排序，值相同的序号统一为最大序号
  - ‘first’：先排序，值相同的序号按照出现次序排
  - ‘dense’：值相同为一组，按照组值排序，组内取相同次序，和min不同，中间没有跳跃
- ascending：True or False，升序还是降序；
- pct：percent，按照百分比显示，将显示的次序除以列、或行元素个数。
round()
Series.round(decimals=0)
- decimals：控制小数位数，小数点后几位，0意思是只取整数

这些统计操作，只对元素类型为数值型的列有效，返回以列索引或行索引为索引的Series