文章目录 一、现象二、解决方案 一、现象 做建模的时候,有时候需要对数据进行去重,之前用SQL实现distinct,但长时间不使用Pandas处理去重数据,突然就犯了难,就得上百度搜搜,所以遇见问题的时候,做个笔记,方便自己日后温故。 二、解决方案 import pandas as pd df = pd.read_csv('data.csv') # df.shape df = df.drop_duplicates(subset = ['user_id']) # df.shape 解决方案:带疑问,多交流,勤动手,频思考