python 数据去重_科学网—python学习——根据条件提取数据,并去重 - 李立的博文...

[Python字符串提取]

摘要:根据要求进行字符串的提取,并去重

导入分析所需的库import pandas as pd

构造数据集

as1 = pd.DataFrame({'a':[1,2,3,4],

'b':['adwdea,asdw;swa,des','swa,dwad;asdw;swa','se;dw,asd;erf,de','de']})

home.php?mod=attachment&filename=%CE%A2%D0%C5%BD%D8%CD%BC1.png&id=258325

编写分析函数

def trans(b):

as1['c'] = b.str.split(";")

c = as1['c'].tolist()

for i in range(len(c)):

for j in range(len(c[i])):

c[i][j] = c[i][j].split(",")[0]

return c

trans(as1['b'])

as1['d'] = as1['c'].apply(lambda x:set(x)).apply(lambda x:",".join(x))

as1

202643ptvmdmet20dae8i9.png

转载本文请联系原作者获取授权,同时请注明本文来自李立科学网博客。

链接地址:http://blog.sciencenet.cn/blog-3262505-1137397.html

下一篇:python学习——数据批量替换

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值