再学习pandas.Series.str.contains

最新推荐文章于 2024-03-05 17:21:24 发布

梓沂

最新推荐文章于 2024-03-05 17:21:24 发布

阅读量957

点赞数

本文链接：https://blog.csdn.net/qq_27361945/article/details/84979905

版权

之前写的脚本是过滤所有行中只包含一个字段的：

area='AREA=2'
df2 = df[df[columnname].str.contains(area)]

过滤前：

过滤后：

但如果想同时过滤包含不同字段的行，就得改成正则表达式的写法：

area='AREA=5|AREA=6|AREA=7|AREA=8'

df2 = df[df[columnname].str.contains(area, regex=True)]

过滤前：

过滤后：

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.str.contains.html

Series.str.contains(pat, case=True, flags=0, na=nan, regex=True)[source]

regex : bool, default True

If True, assumes the pat is a regular expression. 设为True，表示将pat 参数看做正则表达式

If False, treats the pat as a literal string. 设为False，表示将pat 参数看做字符串

Returning ‘house’ and ‘parrot’ within same string.

>>> s1.str.contains('house|parrot', regex=True)
0    False
1    False
2     True
3    False
4      NaN
dtype: object

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

梓沂

关注关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

pandas.Series.str.contains

Stephen的博客

08-06

2020

pandas.Series.str.contains用于判断Series的字符串中是否包含待匹配的模式或者正则表达式，返回的是一个boolean Series。 Parameters: pat：str. Character sequence or regular expression. case：bool, default True. If True, case sensitive. rege...

pandas利用str.contains筛选报错

natsumela的博客

10-12

1983

在使用pandas对excel进行筛选时， df.loc[df['threat_type'].str.contains("DGA")] 出现以下报错： ValueError: Cannot mask with non-boolean array containing NA / NaN values 报的是分组这一列中，包含了非字符串的内容，由于.str.contains的使用要求该字段必须为字符串，不能有数字等，故而在代码上加上 df.loc[df['threat_type'].str.conta

参与评论您还未登录，请先登录后发表或查看评论

pandas--str.contains()

梦船水萍

05-04

1525

针对Series进行操作得到布尔索引 1、或 Series.str.contains('str1|str2') # 符号'|'左右不要加空格 2、且 Series.str.contains('(?=.*str1)(?=.*str2)') # 或者 Series.str.match('(?=.*str1)(?=.*str2)')

[Pandas] 文本包含.str.contains()

Hudas的博客

02-16

1万+

[Pandas] 文本包含.str.contains()

Pandas str.contains() 方法检查是否包含特定子字符串（可用正则）

最新发布

YHKKun的博客

03-05

2262

方法是一个字符串方法，用于确定每个字符串是否包含指定的模式或子字符串。：一个可选的整数或正则表达式标志的集合，用于修改正则表达式的匹配方式。这些标志可以来自Python的。：必需参数，表示要检测的模式或子字符串。用于不区分大小写的匹配。：布尔值，默认为True，表示匹配时。更简单且不涉及正则表达式标志。：布尔值，默认为True，表示。缺失值（NaN）的处理方式。是否应被视为正则表达式。

pandas的 str.contains()函数

weixin_37759495的博客

12-07

6414

str.contains("四川")能查询数据包含"四川"的判断条件 # 导入pandas模块，并以"pd"为该模块的简写 import pandas as pd # 使用pd.read_csv()函数读取路径为 "/Users/find/信用卡用户信息.csv" 的CSV文件，并将结果赋值给变量data data = pd.read_csv(r"C:\Users\Administrator\PycharmProjects\pythonProject\----\pandas\信用卡用户信息.cs..

详解pandas.DataFrame中删除包涵特定字符串所在的行

09-19

在Pandas中，我们可以使用`str.contains()`方法来检查字符串是否包含特定模式。这个方法返回一个布尔型的Series，其中True表示字符串包含指定模式，False则表示不包含。例如，假设我们有一个DataFrame `df`，其中...

pandas Series矢量化的字符串函数——Series.str

悦光阴的博客

08-12

820

在清理文本数据时，对pandas Series(序列)可以使用map函数，所有的字符串都可以应用字符串函数或正则表达式，但是如果存在NA，就会报错。为了解决这个问题，Series有一些可以跳过NA值的字符串操作方法，这可以通过Series的str属性来访问。 s1 = pd.Series(['Mouse', 'dog', 'house and parrot', '23', np.NaN]) s...

dataframe 正则过滤,pandas dataframe/series 正则表达式使用 str.match str.contains str.extract...

weixin_42128988的博客

03-18

1793

pandas dataframe/series 正则表达式使用 str.match str.contains str.extractpandas.Series.str.matchSeries.str.match(pat, case=True, flags=0, na=nan, as_indexer=False)[source]Deprecated: Find groups in each stri...

pandas.Series.str.contains详解

weixin_43484764的博客

05-05

2万+

’’‘Series.str.contains（pat，case = True，flags = 0，na = nan，regex = True)’’' 测试pattern或regex是否包含在Series或Index的字符串中。返回布尔值系列或索引，具体取决于给定模式或正则表达式是否包含在系列或索引的字符串中。 pat ： str类型字符序列或正则表达式。 case ： bool，默认为True...

panda中contains函数的用法

妖白的奇幻漂流世界

10-24

1万+

contains函数就是检查数据中是否包含某种设定的字符 df['Discount_rate'].str.contains(':') 比如这个就是赛选df文件下Discount_rate标签是否包含‘：’这个符号有的话返回Ttue 没有的话返回False 实际情况就是： contains筛选的其实是正则表达式运行结果就是 0 False 1 True 2

pandas.Series.str.contains(筛选）

weixin_43615654的博客

12-07

937

https://blog.csdn.net/weixin_43615654/article/details/103419171 这篇里用到了一个Str的contains函数，查了一下用法。 pandas.Series.str.contains Returns: Series or Index of boolean values A Series or Index of boolean value...

pandas|判断是否包含|contains|isin

craftsman2020的博客

09-01

3124

函数作用测试pattern或regex是否包含在Series或Index的字符串中。返回布尔值系列或索引，具体取决于给定模式或正则表达式是否包含在系列或索引的字符串中。pat ： str类型字符序列或正则表达式。case ： bool，默认为True如果为True，区分大小写。flags ： int，默认为0（无标志）标志传递到re模块，例如re.IGNORECASE。na ：默认NaN填写缺失值的值。na = True 就表示把有NAN的转换为布尔值True。

pandas 通过正则表达式查询和筛选

cuisidong1997的博客

03-21

1756

str.contains（）等同于re.search（），并且可以在flags参数中指定正则表达式标志。要提取部分匹配的行，可以使用pandas的（str.xxx（））方法，根据指定条件提取的字符串方法。当然，可以指定一个正则表达式模式，以转义\？可以通过str.contains（）的参数na来指定替换NaN结果的值。果参数ragex为False，则确定是否包含第一个参数的字符串本身。例如，如果要判断是否包含正则表达式的特殊字符，例如？str.startswith（）：以特定的字符串开头。

str.contains()函数

Say_hi_Bury的博客

11-08

2679

通过将该正则表达式模式传递给`str.contains()`函数，并将`regex=True`参数设置为True，可以实现对DataFrame对象中满足条件的行进行筛选。`regex=True`参数的作用是告诉`str.contains()`函数使用正则表达式模式进行匹配。`str.contains()`函数是pandas库中Series对象的一个方法，用于检查Series中的每个元素是否包含指定的字符串或正则表达式模式。- `regex`：是否使用正则表达式模式，默认为True。

python报错—使用.str.contains()方法替换某一列报错：AttributeError: ‘str‘ object has no attribute ‘str‘及解决方案

sodaloveer的博客

09-15

4606

python报错—使用.str.contains()方法替换某一列报错：AttributeError: 'str' object has no attribute 'str'及解决方案

【谈谈】String.contains()方法