数据分析入门（二）数据清洗

最新推荐文章于 2024-06-10 17:22:02 发布

Mr.kun

最新推荐文章于 2024-06-10 17:22:02 发布

阅读量1.1k

点赞数

分类专栏：数据分析与挖掘 machine-Learing&py tensor etc. 文章标签：数据分析 python 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44307764/article/details/108149615

版权

本文介绍了数据分析过程中的数据清洗步骤，包括缺失值的观察与处理、重复值的处理，以及数值和文本类型数据的预处理。通过Python的pandas库，详细讲解了如何进行缺失值填充、重复值去除、数值类型数据的分箱操作和文本类型数据的转换，为后续分析和建模打下基础。

摘要由CSDN通过智能技术生成

文章目录

缺失值观察与处理
- 缺失值观察
- 缺失值处理
重复值观察与处理
- 重复值观察
- 重复值处理
特征观察与处理

我们得到的数据通常并不是一开始就是我们想要的，这时候我们需要对数据进行清洗，以期望最后以我们所要的方式呈现出来，并且便于后面的分析与建模。
上一篇：数据分析入门一

缺失值观察与处理

我们得到的数据中往往可能会有一些缺失值，这个缺失值如果不进行处理的话，会对我们后面的分析造成很大影响。

缺失值观察

一般我们可以用两种方法对缺失值进行观察，如下：
在这里插入图片描述

在这里插入图片描述

缺失值处理

对于缺失值我们可以将它舍去，有dropna()方法。我们也可以用其他的值进行填充，有fillna()方法。
关于这两个方法如何运用，我们在jupyter中将光标移动到方法处，按Shift+Tab键即可显示。
在这里插入图片描述
还可以去参考官网：

最低0.47元/天解锁文章

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
数据分析入门（二）数据清洗

文章目录缺失值观察与处理缺失值观察缺失值处理重复值观察与处理重复值观察重复值处理特征观察与处理数值类型的分箱操作文本类型数据的处理拓展我们得到的数据通常并不是一开始就是我们想要的，这时候我们需要对数据进行清洗，以期望最后以我们所要的方式呈现出来，并且便于后面的分析与建模。上一篇：数据分析入门一缺失值观察与处理我们得到的数据中往往可能会有一些缺失值，这个缺失值如果不进行处理的话，会对我们后面的分析造成很大影响。缺失值观察一般我们可以用两种方法对缺失值进行观察，如下：缺失值处理对于缺失值我们
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。