python里的df_字符串包含在python中的两个df之间

最新推荐文章于 2023-07-27 15:00:45 发布

weixin_39792472

最新推荐文章于 2023-07-27 15:00:45 发布

阅读量1k

点赞数

文章标签： python里的df

我有两个df和两个字符串列,如下所示:

df1:原始df有2000行名称

Id Name

1 Paper

2 Paper

3 Scissors

4 Mat

5 Cat

6 Cat

第二个df:原始df有1000+项\名称

Item_ID Item_Name

1 Paper Bag

2 wallpaper

3 paper

4 cat cage

我需要列中的字符串

Name

列中的那个

项目名称

第一种方法:使用

str.contains

我知道如何匹配字符串,如果它们是一列,并且有几个字符串要匹配,如下所示:

df[df['Name'].str.contains("paper|cat", na=False)]

但如果有两列字符串(名称和项名称)要匹配,则如何操作

第二种方法:

Fuzzywuzzy

matched = []

for row in df1.index:

name = df1.get_value(row,"Name")

for columns in df2.index:

item_name=df2.get_value(columns,"Item_Name")

matched_token=fuzz.token_sort_ratio(name,item_name)

if matched_token> 80:

matched.append([name,item_name,matched_token])

问题是,它会很慢,我想要的输出是从模糊中得到的。输出如下:

Id Name Item_ID

1 Paper 1,2,3

2 Paper 1,2,3

3 Scissors NA

4 Mat NA

5 Cat 4

6 Cat 4

总结

如果str.contains是两个具有不同列名的df,则如何执行str.contains

如何转换df以获得上述预期输出

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39792472

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python里的df_字符串包含在python中的两个df之间

我有两个df和两个字符串列,如下所示:df1:原始df有2000行名称Id Name1 Paper2 Paper3 Scissors4 Mat5 Cat6 Cat第二个df:原始df有1000+项\名称Item_ID Item_Name1 Paper Bag2 wallpaper3 paper...
复制链接

扫一扫

【Python小技巧】df转字符串用df.to_string()，字符串转换回DataFrame怎么办？

IT里的交易员-博客

06-13

4430

平常我们使用pandas，一般使用的是DataFrame和Series，但个别交换数据的时候，只能使用字符串，我们需要将df转为字符串输出。但交换完的数据，我们又需要将字符串再转回DataFrame格式，这个怎么办呢？下文我们就来看看，如何处理？文中df代表DataFrame数据。将DataFrame转化为str进行数据交换，但最终我们还是需要使用DataFrame来处理数据。在转换回DataFrame时，要注意str的存储内容依然保持DataFrame的格式形式，否则将引起转换异常。

df筛选指定列的字段中含有指定字符串的行

guotianqing的博客

03-08

4634

原始数据假设有以下原始df： import pandas as pd df = pd.DataFrame([['a1','b2'],['c1','d3'],['e3','f4']], columns=['x','y']) print(df) #df x y 0 a1 b2 1 c1 d3 2 e3 f4 含有或不含有指定字符串 筛选出所有含有指定字符串的行： # 找出x列中所有含有a的行： df[df['x'].str.contains('a')] # x y

参与评论您还未登录，请先登录后发表或查看评论

pandas中的文本包含函数.str.contains()

辉的博客

07-30

1万+

str.contains()会判断字符是否有包含关系，返回布尔序列，经常用在数据筛选中，它默认支持，如果不需要，可以关掉。参数na可以指定对空值的处理方式。

python查找字符串所在行_在一列中或在Python的多列中搜索多个字符串时,如何使用str.contains函数的or运算符?...

weixin_39617484的博客

11-26

535

我正在尝试使用str.contains函数在python中搜索列中的“关键字”。我已经成功地在一列中查找了一个关键字。但是,我需要的是:-在一列中搜索多个关键字我正在使用以下示例数据集:Employee Employee ID Category CommentsJack 11234 Holiday Holiday tripBen ...

如何在python pandas的dataframe对象筛选出包含特定字符串的行？

跬步Python股票数据量化分析

05-08

1万+

如何在python pandas的dataframe对象筛选出包含特定字符串的行？以数据集df为例，df包含有name的行。如何筛选出name行中，包含‘酒’字符的行？ df = df[df['name'].str.contains('酒')] 是不是超级简单，试起来吧！这里可以用来股票量化分析中，对行业股票分析，筛选出行业分类中包含酒的行业。 ...

Python去掉字符串中空格的方法

12-24

我们经常在处理字符串时遇到有很多空格的问题，一个一个的去手动删除不是我们程序员应该做的事情，今天这篇技巧的文章软件开发网就来给大家讲一下，如何用Python去除字符串中的空格。我们先创建一个左右都有N个空格...

python excel中替换字符串

09-04

标题“python excel中替换字符串”和描述所指的知识点主要涉及如何在Excel文件中使用Python库来查找并替换特定字符串。这里我们将深入探讨如何使用两个流行的Python库：`openpyxl` 和 `pandas` 来完成这项工作。 ...

python将字符串list写入excel和txt的实例

09-19

本文将详细介绍如何利用Python将一个包含字符串的列表（`list`）写入Excel和TXT文件的具体实现方法。 #### 一、环境准备与库导入首先，确保你的开发环境中安装了必要的Python库。本例中，我们需要使用`numpy`来...

Python字符串学习

12-21

Python字符串是编程中常用的数据类型，它用于存储一系列字符。字符串是不可变的，意味着一旦创建，就不能修改其中的单个字符。以下是一些关于Python字符串的重要知识点： 1. **字符串注释**：在Python中，可以使用...

python字符串的方法与操作大全

12-23

判断指定字符或字符串是否包含在一个字符串内,返回值为true或者false str1="asdfgh" print(str1.__contains__('a')) print(str1.__contains__("df")) print(str1.__contains__('r')) 运行结果： True True False ...

Python数据分析——一些简单实用技巧记录

weixin_57418067的博客

09-20

516

作者比较佛系，本文为佛系内容，记录得有点乱哈，但是这里会有一些较为实用得东西，需要自行筛选，付出才会有收货，而且是满满得干货！

Python数据分析实战-dataframe筛选某字段包含（模糊匹配）某些值的记录（附源码和实现效果）

热门推荐

AaronPaul的博客

03-09

2万+

今天同事问我如果我要判断pandas中某列中的值是否包含某个特定字符串该如何做。我以前写过但是楞了一下，因此好好记录下来 df["columns_1"] = df["columns"].apply(lambda x: x.upper()) #由于同事这个不区分大小写，所以全部转成大写来匹配 df[df["columns_1"].str.contains("a")] #这样只要...

【pandas】df.str.contains包含多个值写法

Asher117的博客

08-18

1万+

直接上代码 df['A'].str.contains('str1|str2')

pandas 小技巧——df如何筛选包含特定字符的列（或者行）

lanyuelvyun的博客

10-11

1万+

dataFrame如何筛选包含指定字符的列 [x for x in df.columns if '指定字符' in x] dataFrame如何筛选包含指定字符的行 df[df['列名'].str.contains('指定字符')]

python中df是什么,python中包含两个df之间的字符串

weixin_34824634的博客

03-25

2168

我有两个df和两个字符串列，如下所示：Df1：原始df有2000行名称Id Name1 Paper2 Paper3 Scissors4 Mat5 Cat6 Cat第二个测向：原始测向有1000多个项目名称^{pr2}$我需要列Name中的字符串，它们位于列项名称中第一种方法：使用str.contains：我知道如何匹配字符串，如果它们是一列和要...

Pandas过滤DataFrame中包含特定字符串的数据

dta0502的博客

12-24

1万+

假如有一列全是字符串的DataFrame，希望提取包含特定字符的所有数据，该如何提取呢？ 1、首先将他们进行字符串化，并得到其对应的布尔值 df_town['name'].str.contains("镇") 2、通过DataFrame的基本操作将其选取出来 df_town_town = df_town[bool] 总结：这样就成功将特定数据选取出来了，将代码汇总一下就是： df_town_to...

Python3 格式化字符串：指定列宽

"《Python Cookbook》是一本关于Python编程技巧的参考书籍，涵盖了数据结构、字符串和文本处理、数字日期和时间以及迭代器与生成器等多个主题。在2.16章节中，主要讨论了如何以指定列宽格式化字符串，这对于在输出...