按列去重

data_np = data.drop_duplicates() ,data所有列完全相同才会删除

data_np = data.drop_duplicates(['a','b']) 

去重机制,去重是保留第一条记录还是最后一条记录,可以通过drop_duplicate中的参数keep控制

data.drop_duplicates(['a','b'],keep='last'),默认保留第一个出现的值

阅读更多
想对作者说点什么?

博主推荐

换一批

没有更多推荐了,返回首页