【pandas】df.str.contains包含多个值写法

直接上代码

df['A'].str.contains('str1|str2')
这段代码是Python语言的一段数据处理代码。我将逐行解释它的意思: 1. `for i in coolist:`:这是一个循环语句,`coolist`是一个列表,`i`是列表中的每个元素。 2. `#print(i)`:这是一个注释,表示将`i`打印出来。注释用于解释代码的目的,对代码本身没有实质性影响。 3. `df2.loc[df2['source1'].str.contains(i),'source']=i`:这行代码是通过定位和筛选DataFrame中符合条件的元素,将`df2`中`source1`列中包含字符串`i`的行的`source`列设置为`i`。 4. `df2.loc[df2['target1'].str.contains(i), 'target'] = i`:这行代码是通过定位和筛选DataFrame中符合条件的元素,将`df2`中`target1`列中包含字符串`i`的行的`target`列设置为`i`。 5. `df2.dropna(inplace=True)`:这行代码是删除DataFrame中包含缺失(NaN)的行。 6. `df2 = df2[df2['source'] != df2['target']]`:这行代码是筛选出`df2`中`source`列不等于`target`列的行。 7. `#df2 = df2.drop_duplicates(subset=['source', 'target'])`:这行代码是注释掉了,原本用于删除重复行,根据'source'和'target'两列的数进行去重。 8. `df2.to_csv("D:\\paper\\network新\\2012\\边列表(删除单个单位&提取大学名).csv")`:这行代码是将处理后的`df2`数据保存为CSV文件,保存路径为"D:\\paper\\network新\\2012\\边列表(删除单个单位&提取大学名).csv"。 综合起来,这段代码的作用是根据`coolist`中的元素,对`df2`进行一系列的筛选、替换和删除操作,最终将处理后的结果保存为CSV文件。
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值