Dataframe两列值去重

最新推荐文章于 2023-09-06 22:26:41 发布

羊羊猪

最新推荐文章于 2023-09-06 22:26:41 发布

阅读量2.2k

点赞数 2

分类专栏： python随手技巧文章标签： python list pandas 数据分析

本文链接：https://blog.csdn.net/weixin_46599926/article/details/122983676

版权

python随手技巧专栏收录该内容

27 篇文章 4 订阅

订阅专栏

有时候处理数据的时候会遇到这样的情况，尽管两列合在一起后表达的意思一样，但无法直接把他们去重
在这里插入图片描述

因此我们可以在去重前多进行一步，把两列数据合并成 list 后去重，再把他们分开

# 1.合并数据，转换成 list
df['ls'] = list(map(lambda x,y:[x,y],df['a_attr_single'],df['b_attr_single']))
# 2.对 list 里的数据进行排序处理
df['ls'] = df['ls'].apply(lambda x:','.join(sorted(x)))
# 3. 删除被合并的两列
df.drop(columns=['a_attr_single', 'b_attr_single'], inplace=True)
# 4. 去重
df = df.drop_duplicates()
# 分开list里的数据值
df['attr1'], df['attr2'] = df['ls'].str.split(',', 1).str

Output
在这里插入图片描述

羊羊猪

关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
1
评论
Dataframe两列值去重

有时候处理数据的时候会遇到这样的情况，尽管两列合在一起后表达的意思一样，但无法直接把他们去重因此我们可以在去重前多进行一步，把两列数据合并成 list 后去重，再把他们分开# 1.合并数据，转换成 listdf['ls'] = list(map(lambda x,y:[x,y],df['a_attr_single'],df['b_attr_single']))# 2.对 list 里的数据进行排序处理df['ls'] = df['ls'].apply(lambda x:','.join(sort
复制链接

扫一扫