![b139b6da0173938994e7e41b25a3f254.png](https://i-blog.csdnimg.cn/blog_migrate/c624ff232193856f943508b074c52e6c.jpeg)
数据清洗和准备
7.1 处理缺失值
滤除缺失值
对于一个Series,dropna函数返回一个仅含有非空数据和索引值的Series
![ac854d8c45be5208c9c76d58446f7c9e.png](https://i-blog.csdnimg.cn/blog_migrate/b03e7498ad9f214f8222349786fc1df3.jpeg)
而对于DataFrame,默认丢弃含有nan的行,如果不想执行的如此严格,可以传入how = 'all'只丢弃全为nan的行
![b56ff5a5702bf4d424452d0504cd5de0.png](https://i-blog.csdnimg.cn/blog_migrate/c39ce21ac4c999c1fb048d39f53e45c0.jpeg)
传入轴参数可以指定丢弃含有nan的行或者列
![0cf0e152352e35192f131a0b0b1a8658.png](https://i-blog.csdnimg.cn/blog_migrate/71e1513d442707bd4c9fe30c6aea125b.jpeg)
还有一个thresh参数,thresh = n意思是保留至少有n个非nan值的行
![7367bb6f421157347f2a069deb059f22.png](https://i-blog.csdnimg.cn/blog_migrate/a8e410dde78593e4f9304aba9ea384f4.jpeg)
填充缺失数据
主要用fillna函数来填补缺失值
向fillna函数传入整数就是用该整数填补缺失值,传入字典可以实现对不同列的缺失值用不同值来填补,而且此函数返回一个新对象,可以使用inplace = True来实现就地修改
![51c3256b7b2a38c33fdf961da39c148f.png](https://i-blog.csdnimg.cn/blog_migrate/d287091a88b388c7fa0cc591bb35abe0.jpeg)
reindex的填充方法对fillna函数也有效果,如method = 'ffill',limit = 2
![c9d845caa88e0bd91f35308f48fd2a7f.png](https://i-blog.csdnimg.cn/blog_migrate/866fe6449f5802559c8528bb06e60a26.jpeg)
fillna函数的参数:
![2d78826ec14a16d69f2dc613b232ec5b.png](https://i-blog.csdnimg.cn/blog_migrate/559264b9cb46e7de2ee19dde2f2867d1.png)