# [利用Python Pandas进行数据预处理-数据清洗](http://blog.csdn.net/yen_csdn/article/details/53445616)
标签: [python](http://www.csdn.net/tag/python)[数据分析](http://www.csdn.net/tag/%e6%95%b0%e6%8d%ae%e5%88%86%e6%9e%90)[异常](http://www.csdn.net/tag/%e5%bc%82%e5%b8%b8)[pandas](http://www.csdn.net/tag/pandas)[数据预处理](http://www.csdn.net/tag/%e6%95%b0%e6%8d%ae%e9%a2%84%e5%a4%84%e7%90%86)
2016-12-03 17:54 30794人阅读 [评论](http://blog.csdn.net/yen_csdn/article/details/53445616#comments)(0) [收藏](javascript:void(0);) [举报](http://blog.csdn.net/yen_csdn/article/details/53445616#report)
![img](http://static.blog.csdn.net/images/category_icon.jpg) 分类:
Python知识体系-----------------*(21)* ![img](http://static.blog.csdn.net/images/arrow_triangle%20_down.jpg) ----【Python数据科学】*(7)* ![img](http://static.blog.csdn.net/images/arrow_triangle%20_down.jpg)
版权声明:本文为博主原创文章,未经博主允许不得转载。
> 数据缺失、检测和过滤异常值、移除重复数据
**数据缺失**
数据缺失在大部分数据分析应用中都很常见,Pandas使用浮点值NaN表示浮点和非浮点数组中的缺失数据,他只是一个便于被检测出来的数据而已。
```
from pandas import Series,DataFrame
string_data=Series(['abcd','efgh','ijkl','mnop'])
print(string_data)
print("...........\n")
print(string_data.isnull())1234567
```
![这里写图片描述](https://img-blog.csdn.net/20161203163334214)
Python内置的None值也会被当作NA处理
```
from pandas import Series,DataFrame
string_data=Series([&