python-pandas dataframe正则筛选包含某字符串的列数据str.contains()

本文介绍了如何使用Python的pandas库中Series.str.contains方法,通过正则表达式进行数据筛选。无论是模糊查找还是精确匹配,都提供了详细步骤和实例,助您高效筛选DataFrame中的数据。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

用法:

Series.str.contains(pat, case=True, flags=0, na=nan, regex=True)
  • 参数:
    pat: 字符序列或正则表达式。
    case: 如果为True,则区分大小写。
    flags: 要传递给re模块的标志,例如重新IGNORECASE。
    na: 填写缺失值的值。
    regex: 如果为True,则假定pat是一个正则表达式。

  • 模糊过滤:

Bool = df.列名.str.contains("某字符串")

可以通过 | , 来加多字符串,来进行筛选。

Bool = df.列名.str.contains("某字符串0 | 某字符串1")

返回布尔值的序列或索引,True则是符合筛选条件的数据。

在这里插入图片描述
利用Bool的索引即可筛选到需要的内容。

df = df[Bool]

在这里插入图片描述也可以通过 ~ ,进行反转。(获取除以上数据的所有数据)
在这里插入图片描述

  • 正则匹配

df = df[df.列名.str.contains(".*?某字符串 | .*?某字符串")]
在数据处理的过程中,常常需要从庞大的数据集中筛选出特定信息。使用Pandas库中的字符串方法和条件筛选功能,可以高效地完成这一任务。为了帮助你更深入地理解并掌握如何使用Pandas过滤包含特定字符串的数据,建议参考这份资料:《Pandas过滤dataframe包含特定字符串的数据方法》。 参考资源链接:[Pandas过滤dataframe包含特定字符串的数据方法](https://wenku.csdn.net/doc/6412b534be7fbd1778d4250d?spm=1055.2569.3001.10343) 首先,我们需要导入Pandas库,并创建一个示例DataFrame进行操作演示。假设我们有一个数据集,其中包含着用户信息,我们想要筛选出所有名字中含有'John'的用户数据。以下是具体的操作步骤和示例代码: ```python import pandas as pd # 创建一个示例DataFrame data = { 'Name': ['John Doe', 'Jane Smith', 'Johnathan Appleseed', 'Lisa Simpson'], 'Email': ['john.***', 'jane.***', 'john_***', 'lisa.***'], 'Age': [30, 25, 35, 28] } df = pd.DataFrame(data) # 使用str.contains()方法筛选包含'John'的行 filtered_df = df[df['Name'].str.contains('John')] # 打印结果 print(filtered_df) ``` 在上述代码中,我们首先导入了Pandas库,并创建了一个包含用户信息的DataFrame。然后,我们使用`str.contains()`方法对'Name'列进行操作,筛选出所有包含'John'的行,并将结果存储在`filtered_df`中。最后,我们打印出筛选后的DataFrame,可以看到只包含了含有'John'的行。 此外,`str.contains()`方法支持正则表达式,因此可以灵活应对各种复杂的字符串匹配需求。比如,如果我们想筛选出同时包含'John'和'Doe'的完整名字,可以使用如下代码: ```python filtered_df = df[df['Name'].str.contains('John.*Doe')] ``` 在掌握了如何使用Pandas进行字符串筛选之后,你将能够更加灵活地处理数据集,提取出有价值的信息。如果希望进一步了解Pandas字符串处理功能以及其他高级筛选技巧,请查看《Pandas过滤dataframe包含特定字符串的数据方法》这份资源。该资料不仅提供了关于字符串筛选的详细讲解,还介绍了更多数据清洗和处理的实战技巧,帮助你全面提高数据分析的效率和准确性。 参考资源链接:[Pandas过滤dataframe包含特定字符串的数据方法](https://wenku.csdn.net/doc/6412b534be7fbd1778d4250d?spm=1055.2569.3001.10343)
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值