OUTLINE:
- drop_dupicates
- merge
drop_dupicates
参数含义:
subset:即表示要去重指定参考的列
keep : {‘first’, ‘last’, False}, default ‘first’
inplace:boolean, default False, 直接在原来的数据上修改还是保留副本
data = pd.DataFrame({'id':[1,1,2],'value':[12,14,27]})
#第一个参数传入需要比对的列,在"id"列有相同的id,则进行去重
data.drop_duplicates(['id'],keep='last',inplace=True)
#我想比较"id"、"value"两列的值全部相同时则去重
data.drop_duplicates(['id','value'],k