pandas 索引去重_Pandas 同元素多列去重的实例

本文介绍了如何使用Pandas对具有相同元素的多列数据进行去重,提供了一种简单高效的方法,包括数据预处理和关键代码示例。通过排序组合列元素并创建新列,然后利用drop_duplicates函数实现去重。
摘要由CSDN通过智能技术生成

Pandas 同元素多列去重的实例

有一些问题可能会遇到同元素多列去重问题,下面介绍一种非常简单效率也很快的做法,用pandas来实现。

首先我们看一下数据类型:

G1 G2

a b

b a

c d

d c

e f

对这样的两列数据进行同元素去重,最终得到结果为:

G1 G2

a b

c d

e f

代码如下:

#-*- coding: utf-8 -*-

data = {'G1':['a','b','c','d','e'],'G2':['b','a','d','c','f']}

data = pd.DataFrame(data)

data['G3'] = data['G1'] + '|' + data['G2']

p = []

for i in data['G3'].tolist():

tmp = sorted(i.split('|')) # The most important part,sort

p.append(tmp[0] + '|' + tmp[1])

data['G3'] = pd.Series(p)

data = data.drop_duplicates('G3

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值