python数据分析——数据清理(二)

上一章给大家介绍了如何查看数据与选取你所需要的数据,这篇给大家介绍一下选择完数据如何对数据进行处理。 往往我们拿到的数据经过查看过都会存在一些不能满足需求的问题,这时就可能需要对原数据进行一些修改与整理。比如:Python字段名修改、列名选择修改、索引重置、异常值替换、数据类型转化、数据组合等。还是主要给大家介绍一下一些常用涉及到的方法,本章结构请见目录:一、清理数据列名修改索引修...
摘要由CSDN通过智能技术生成

上一章给大家介绍了如何查看数据与选取你所需要的数据,这篇给大家介绍一下选择完数据如何对数据进行处理。

往往我们拿到的数据经过查看过都会存在一些不能满足需求的问题,这时就可能需要对原数据进行一些修改与整理。比如:Python字段名修改、列名选择修改、索引重置、异常值替换、数据类型转化、数据组合等。还是主要给大家介绍一下一些常用涉及到的方法,本章结构请见目录:

一、清理数据

列名修改
属性 描述
df.columns = [‘a’,‘b’,‘c’] 重命名列名,全部一起改
df.rename(columns={‘a’: ‘A’, ‘b’: ‘B’, ‘c’: ‘C’}, inplace=True) 修改部分列名,inplace=True并直接覆盖
df.set_index(‘col1’) 更改索引列,把指定列变成索引
索引修改
属性 描述
df.set_index(‘column_one’) 更改索引列,列变索引
df.reset_index() 将索引变成列或属性drop=true重置索引
内容修改
属性 描述
pd.cut(s,list) 将数据列进行分段,pd.cut(data,[0,10,20,30])
pd.isnull() 检查DataFrame对象中的空值,并返回一个Boolean数组
pd.notnull() 检查DataFrame对象中的非空值,并返回一个Boolean数组
df.drop(‘a’,axis=1) 删除a列所有数据
df.dropna()
  • 0
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值