经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。后来才发现,原来不是 Python 数据处理厉害,而是他有数据分析神器—— pandas
前言
有时候数据中出现重复值,可能会导致最后的统计结果出现错误,因此,查找和移除重复值是数据处理中的常见操作。今天我们来看看 pandas 中是如何实现。
Excel 处理重复值
Excel 中直接提供了去除重复的功能,因此简单操作即可实现。如下:
功能卡"数据","数据工具"中有"删除重复项"按钮
接着可以选择以哪些列作为重复判断
除此之外,Excel 中还可以使用条件格式、高级筛选或函数公式实现差不多的功能
pandas 标记重复值
pandas 中同样提供一个简单方法标记出重复值,并且比 Excel 有