python-pandas dataframe正则筛选包含某字符串的列数据str.contains()

李墨策

已于 2022-05-01 23:10:39 修改

阅读量1.7w

点赞数 12

分类专栏： python 文章标签： python pandas

于 2021-08-07 16:07:55 首次发布

本文链接：https://blog.csdn.net/qq_35706314/article/details/119487138

版权

python 专栏收录该内容

1 篇文章

订阅专栏

本文介绍了如何使用Python的pandas库中Series.str.contains方法，通过正则表达式进行数据筛选。无论是模糊查找还是精确匹配，都提供了详细步骤和实例，助您高效筛选DataFrame中的数据。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

用法:

Series.str.contains(pat, case=True, flags=0, na=nan, regex=True)

参数：
pat: 字符序列或正则表达式。
case: 如果为True，则区分大小写。
flags: 要传递给re模块的标志，例如重新IGNORECASE。
na: 填写缺失值的值。
regex: 如果为True，则假定pat是一个正则表达式。
模糊过滤：

Bool = df.列名.str.contains("某字符串")

可以通过 | ，来加多字符串，来进行筛选。

Bool = df.列名.str.contains("某字符串0 | 某字符串1")

返回布尔值的序列或索引，True则是符合筛选条件的数据。

在这里插入图片描述
利用Bool的索引即可筛选到需要的内容。

df = df[Bool]

在这里插入图片描述也可以通过 ~ ，进行反转。（获取除以上数据的所有数据）

正则匹配

df = df[df.列名.str.contains(".*?某字符串 | .*?某字符串")]

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

李墨策

关注关注

12
点赞
踩
89

收藏

觉得还不错? 一键收藏
3
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

使用pandas筛选DataFrame中不包含特定字符串的数据行

与其临渊羡鱼,不如退而结网

09-04

1684

如果我们想要筛选出DataFrame中某一列的值不包含特定字符串的数据行，可以使用pandas库提供的功能来实现这一目标。本文将介绍如何使用pandas来筛选DataFrame中不包含特定字符串的数据行，并提供相应的源代码示例。除了上述示例中使用的字符串包含性质的筛选，我们还可以使用正则表达式来进行更加复杂的模式匹配。在上述代码中，我们使用~操作符对str.contains()方法的结果进行取反，从而筛选出City列不包含字符串"New"的数据行。安装完成后，我们可以开始编写代码。

使用 Pandas 的 str 函数和 contains 函数在 DataFrame 的特定数据列中查看是否匹配或包含特定模式的字符串

TechBurst的博客

09-05

419

使用 Pandas 的 str 函数和 contains 函数在 DataFrame 的特定数据列中查看是否匹配或包含特定模式的字符串在数据分析和处理中，经常需要对字符串进行匹配和搜索操作。Pandas 是一个强大的数据处理库，提供了许多方便的函数来处理和操作数据。其中，str 函数和 contains 函数是两个常用的函数，可以用于在 DataFrame 的特定数据列中查看是否匹配或包含特定模式的字符串。本文将详细介绍如何使用这两个函数进行字符串匹配和搜索。

3 条评论您还未登录，请先登录后发表或查看评论

Pandas使用教程 - 正则表达式高级应用 (regex)

最新发布

qq_42568323的博客

02-28

621

断言（Assertions）断言允许我们匹配某个模式前或后的内容，而不将这些内容纳入最终匹配结果。正向先行断言（Positive Lookahead）=...)foo(?=bar)匹配 “foo”，仅当其后紧跟 “bar” 时。负向先行断言（Negative Lookahead）!...)foo(?!bar)匹配 “foo”，前提是其后不是 “bar”。正向后行断言（Positive Lookbehind）<=...)<=foo)bar匹配 “bar”，仅当其前有 “foo”。

dataframe应用str.contains+将多列连接成一列

定期分享我的发现和想法，感谢你的陪伴和支持

11-15

6755

参考链接：https://blog.csdn.net/weixin_42782150/article/details/103668814。参考链接：https://www.coder.work/article/3136827。我正在尝试删除包含某些字符串的行。因此我需要换种方法将多列合并成一列。噢终于解决了，ending。我怎样才能解决这个问题？

判断DataFrame指定的列中的每行是否包含指定字符串dataframe.列名.str.contains()

liujingwei8610的专栏

04-05

2854

判断DataFrame指定的列中的每行是否包含指定字符串 dataframe.列名.str.contains()

str.contains()函数

Say_hi_Bury的博客

11-08

3565

通过将该正则表达式模式传递给`str.contains()`函数，并将`regex=True`参数设置为True，可以实现对DataFrame对象中满足条件的行进行筛选。`regex=True`参数的作用是告诉`str.contains()`函数使用正则表达式模式进行匹配。`str.contains()`函数是pandas库中Series对象的一个方法，用于检查Series中的每个元素是否包含指定的字符串或正则表达式模式。- `regex`：是否使用正则表达式模式，默认为True。

DataFrame通过正则表达式筛选包含的数据

Steve_Olson

12-06

2228

示例 import re df=df.fillna('') df.loc[df.apply(lambda x:True if re.search('处理中|暂不解决',x['解决状态'],re.I) else False,axis=1)] 判断 lambda x:True if re.search(正则表达式,字符串,re.I) else False 符合条件的返回True 否则返回False None处理 df=df.fillna('') 避免正则函数中接收非字符串内容 ...

详解pandas.DataFrame中删除包涵特定字符串所在的行

09-19

总的来说，Pandas提供了灵活的方法来处理字符串数据，包括删除包含特定字符串的行。通过结合`str.contains()`、正则表达式以及布尔索引，我们可以高效地完成这类任务。在实际工作中，理解并熟练掌握这些技巧对于数据...

python提取包含特定字符串的行_Pandas过滤dataframe中包含特定字符串数据的方法整理...

weixin_39638468的博客

11-24

3345

Pandas过滤dataframe中包含特定字符串数据假如有一列全是字符串的dataframe，希望提取包含特定字符的所有数据，该如何提取呢？因为之前尝试使用filter，发现行不通，最终找到这个行得通的方法。举例说明：我希望提取所有包含'Mr.'的人名1、首先将他们进行字符串化，并得到其对应的布尔值：>>> bool = df.str.contains('Mr\.') #不要忘记正则表达式的写法...

Pandas过滤dataframe中包含特定字符串的数据方法

12-24

假如有一列全是字符串的dataframe，希望提取包含特定字符的所有数据，该如何提取呢？因为之前尝试使用filter，发现行不通，最终找到这个行得通的方法。举例说明：我希望提取所有包含’Mr.’的人名 1、首先将他们...

从Python pandas.DataFrame数据表中提取或删除包含指定字符串的行

m0_67390379的博客

06-21

8779

有时候需要删除数据表中某一列中包含指定字符串的行，可以使用pandas的字符串包含函数.str.contains：官网详细解释链接：https://pandas.pydata.org/docs/reference/api/pandas.Series.str.contains.html?highlight=contains#pandas.Series.str.contains示例：提取pandas dataframe中’商品名称‘列包含’手机’字符的所有数据：删除pandas dataframe中’商品名

dataframe 正则过滤,熊猫DataFrame过滤器正则表达式

weixin_32900811的博客

12-24

1140

I don't understand pandas DataFrame filter.Setupimport pandas as pddf = pd.DataFrame([['Hello', 'World'],['Just', 'Wanted'],['To', 'Say'],['I\'m', 'Tired']])Problemdf.filter([0], regex=r'(Hel|Just)', ...

pandas中DataFrame字符串过滤之正则表达式

S_o_l_o_n的博客

01-13

2万+

DataFrame中有一种很有效的过滤方式是df[bool exp]，其中的bool exp为布尔表达式，可以是关于df的任何可以产生布尔值的运算或判断，并且还可以是多个布尔表达式的逻辑运算用括号分隔。如果其中的元素是字符串，当然也可以用上述的方式狗率，但是如果过滤条件比较复杂，则可以用Series.str.contains(pat,case=True,flag...

python - 在 DataFrame 中使用正则表达式

PeersLee的博客

09-12

2万+

1. 正则表达式文档 Python正则表达式指南 Python爬虫入门七之正则表达式 2. example df[['室', '厅', '厨', '卫']] = df['户型'].str.extract('(\d+)室(\d+)厅(\d+)厨(\d+)卫', expand=False) df.head(3)

python报错—使用.str.contains()方法替换某一列报错：AttributeError: ‘str‘ object has no attribute ‘str‘及解决方案

sodaloveer的博客

09-15

5321

python报错—使用.str.contains()方法替换某一列报错：AttributeError: 'str' object has no attribute 'str'及解决方案

pandas--str.contains()

梦船水萍

05-04

1614

针对Series进行操作得到布尔索引 1、或 Series.str.contains('str1|str2') # 符号'|'左右不要加空格 2、且 Series.str.contains('(?=.*str1)(?=.*str2)') # 或者 Series.str.match('(?=.*str1)(?=.*str2)')

Pandas过滤DataFrame中包含特定字符串的数据

dta0502的博客

12-24

1万+

假如有一列全是字符串的DataFrame，希望提取包含特定字符的所有数据，该如何提取呢？ 1、首先将他们进行字符串化，并得到其对应的布尔值 df_town['name'].str.contains("镇") 2、通过DataFrame的基本操作将其选取出来 df_town_town = df_town[bool] 总结：这样就成功将特定数据选取出来了，将代码汇总一下就是： df_town_to...

python contains 正则_python 正则和xpath的问题

weixin_35814475的博客

12-24

258

OPPO广告平台#first_dlg .confirm_link{display: inline-block;}.cancel_btn{height:44px;line-height:44px;text-align:center;width:100px;cursor:pointer;display:inline-block;color:#2aad6f;background:#d4eee1;marg...

Pandas 过滤dataframe中包含特定字符串的数据

热门推荐

yyhhlancelot的博客

08-30

10万+

假如有一列全是字符串的dataframe，希望提取包含特定字符的所有数据，该如何提取呢？因为之前尝试使用filter，发现行不通，最终找到这个行得通的方法。举例说明：我希望提取所有包含'Mr.'的人名 1、首先将他们进行字符串化，并得到其对应的布尔值： >>> bool = df.str.contains('Mr\.') #不要忘记正则表达式的写法，'.'在...

在Pandas中，如何快速定位并筛选出DataFrame某一列中包含特定字符串的所有行？

11-02

在数据处理的过程中，常常需要从庞大的数据集中筛选出特定信息。使用Pandas库中的字符串方法和条件筛选功能，可以高效地完成这一任务。为了帮助你更深入地理解并掌握如何使用Pandas来过滤包含特定字符串的数据，建议参考这份资料：《Pandas过滤dataframe中包含特定字符串的数据方法》。参考资源链接：[Pandas过滤dataframe中包含特定字符串的数据方法](https://wenku.csdn.net/doc/6412b534be7fbd1778d4250d?spm=1055.2569.3001.10343) 首先，我们需要导入Pandas库，并创建一个示例DataFrame进行操作演示。假设我们有一个数据集，其中包含着用户信息，我们想要筛选出所有名字中含有'John'的用户数据。以下是具体的操作步骤和示例代码： ```python import pandas as pd # 创建一个示例DataFrame data = { 'Name': ['John Doe', 'Jane Smith', 'Johnathan Appleseed', 'Lisa Simpson'], 'Email': ['john.***', 'jane.***', 'john_***', 'lisa.***'], 'Age': [30, 25, 35, 28] } df = pd.DataFrame(data) # 使用str.contains()方法筛选出包含'John'的行 filtered_df = df[df['Name'].str.contains('John')] # 打印结果 print(filtered_df) ``` 在上述代码中，我们首先导入了Pandas库，并创建了一个包含用户信息的DataFrame。然后，我们使用`str.contains()`方法对'Name'列进行操作，筛选出所有包含'John'的行，并将结果存储在`filtered_df`中。最后，我们打印出筛选后的DataFrame，可以看到只包含了含有'John'的行。此外，`str.contains()`方法支持正则表达式，因此可以灵活应对各种复杂的字符串匹配需求。比如，如果我们想筛选出同时包含'John'和'Doe'的完整名字，可以使用如下代码： ```python filtered_df = df[df['Name'].str.contains('John.*Doe')] ``` 在掌握了如何使用Pandas进行字符串筛选之后，你将能够更加灵活地处理数据集，提取出有价值的信息。如果希望进一步了解Pandas的字符串处理功能以及其他高级筛选技巧，请查看《Pandas过滤dataframe中包含特定字符串的数据方法》这份资源。该资料不仅提供了关于字符串筛选的详细讲解，还介绍了更多数据清洗和处理的实战技巧，帮助你全面提高数据分析的效率和准确性。参考资源链接：[Pandas过滤dataframe中包含特定字符串的数据方法](https://wenku.csdn.net/doc/6412b534be7fbd1778d4250d?spm=1055.2569.3001.10343)

python-pandas dataframe正则筛选包含某字符串的列数据str.contains()

模糊过滤：

正则匹配