学习原处链接:https://blog.csdn.net/zw0Pi8G5C1x/article/details/84610050/
https://www.jianshu.com/p/a93fe1423bc5
1.数据重复
panadas提供查看、处理重复数据的方法duplicated和drop_duplicates。
duplicated可以查看重复的数据。
drop_duplicates方法可以去重。
2.缺失数据处理
缺失值一般有NA表示,在处理缺失值时要遵循一定的原则。
首先应弄清缺失值产生的原因,再通过经验进行填补。