python 数据清洗豆瓣电影_python 数据清洗豆瓣电影_一文搞懂常见的 Python 数据清洗...

最新推荐文章于 2023-05-22 09:44:38 发布

虎嗅APP

最新推荐文章于 2023-05-22 09:44:38 发布

阅读量461

点赞数

文章标签： python 数据清洗豆瓣电影

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_29224347/article/details/113496019

版权

在数据分析中，我们会遇到各种各样的数据，在分析前，要投入大量的时间和精力把数据整理成自己想要或需要的样子。

为什么呢？因为我们采集到的数据往往有很多问题。

import pandas as pd

import numpy as np

data = {

'id':['1','2','3','4',np.nan,'5','6'],

'name':['mouse','Mini','McDuck','Pink',np.nan,'Huey','Huey'],

'age':[56.0,56.0,23.0,32.0,np.nan,152.0,152.0],

'Weight':['70kgs','154.89lbs',np.nan,'78kgs',np.nan,'198.658lbs','198.658lbs']

}

df = pd.DataFrame(data)

print(df)

thread-14778696-1-1.html 示例数据

这一份简单的数据，我们一眼就能看出很多问题。日常工作中的数据业务会复杂很多，通常我们要统计更多的数据维度，数据量也可能会更大，比如超过TB、EB级别。所以，这就造成数据分析的处理难度呈指数级增加的。

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python 数据清洗豆瓣电影_python 数据清洗豆瓣电影_一文搞懂常见的 Python 数据清洗...

在数据分析中，我们会遇到各种各样的数据，在分析前，要投入大量的时间和精力把数据整理成自己想要或需要的样子。为什么呢？因为我们采集到的数据往往有很多问题。import pandas as pdimport numpy as npdata = {'id':['1','2','3','4',np.nan,'5','6'],'name':['mouse','Mini','McDuck','Pink',np...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。