Python 数据清洗

本文详细介绍了Python数据清洗的各个步骤,包括查看数据、处理缺失值、删除重复值、修改数据类型、处理异常值和字符串操作。通过data.head()、data.tail()、data.sample()、data.isnull().sum()等方法进行数据抽样和统计,使用fillna()填充缺失值,dropna()删除缺失值,drop_duplicates()删除重复值,并展示了astype()和describe()在数据类型转换和异常值处理中的应用。
摘要由CSDN通过智能技术生成


基于第三方库Numpy及Pandas 进行数据清洗

1. 查看数据

查看数据
数据抽样
整体概况
字段解读
数据形状
判断数据规模

1.1. 数据抽样

  • 查看前n条数据 : data.head(n) 默认前5条
  • 查看后n条数据: data.tail(n) 默认后5条
  • 随机抽样: data.sample(n) 默认抽取1条

1.2. 数据形状

data.shape 元组类型

  • 显示: (行数, 列数)
  • 注意: shape是属性, 不加’()’

1.3. 数据整体情况

data.info()

  • 内部显示整体长度及每一列的非空长度和数据类型
  • 注意: info()函数没有返回值, 只有输出, 所以只能看到而不能获取到

2. 缺失值处理

  • 0
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值