上一章给大家介绍了如何查看数据与选取你所需要的数据,这篇给大家介绍一下选择完数据如何对数据进行处理。
往往我们拿到的数据经过查看过都会存在一些不能满足需求的问题,这时就可能需要对原数据进行一些修改与整理。比如:Python字段名修改、列名选择修改、索引重置、异常值替换、数据类型转化、数据组合等。还是主要给大家介绍一下一些常用涉及到的方法,本章结构请见目录:
一、清理数据
列名修改
属性 |
描述 |
df.columns = [‘a’,‘b’,‘c’] |
重命名列名,全部一起改 |
df.rename(columns={‘a’: ‘A’, ‘b’: ‘B’, ‘c’: ‘C’}, inplace=True) |
修改部分列名,inplace=True并直接覆盖 |
df.set_index(‘col1’) |
更改索引列,把指定列变成索引 |
索引修改
属性 |
描述 |
df.set_index(‘column_one’) |
更改索引列,列变索引 |
df.reset_index() |
将索引变成列或属性drop=true重置索引 |
内容修改
属性 |
描述 |
pd.cut(s,list) |
将数据列进行分段,pd.cut(data,[0,10,20,30]) |
pd.isnull() |
检查DataFrame对象中的空值,并返回一个Boolean数组 |
pd.notnull() |
检查DataFrame对象中的非空值,并返回一个Boolean数组 |
df.drop(‘a’,axis=1) |
删除a列所有数据 |
df.dropna() |