python 数据清洗 豆瓣电影_python 数据清洗 豆瓣电影_一文搞懂常见的 Python 数据清洗...

在数据分析中,我们会遇到各种各样的数据,在分析前,要投入大量的时间和精力把数据整理成自己想要或需要的样子。

为什么呢?因为我们采集到的数据往往有很多问题。

import pandas as pd

import numpy as np

data = {

'id':['1','2','3','4',np.nan,'5','6'],

'name':['mouse','Mini','McDuck','Pink',np.nan,'Huey','Huey'],

'age':[56.0,56.0,23.0,32.0,np.nan,152.0,152.0],

'Weight':['70kgs','154.89lbs',np.nan,'78kgs',np.nan,'198.658lbs','198.658lbs']

}

df = pd.DataFrame(data)

print(df)

thread-14778696-1-1.html示例数据

这一份简单的数据,我们一眼就能看出很多问题。日常工作中的数据业务会复杂很多,通常我们要统计更多的数据维度,数据量也可能会更大,比如超过TB、EB级别。所以,这就造成数据分析的处理难度呈指数级增加的。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值