pandas中DataFrame字符串过滤之正则表达式

       DataFrame中有一种很有效的过滤方式是df[bool exp],其中的bool exp为布尔表达式,可以是关于df的任何可以产生布尔值的运算或判断,并且还可以是多个布尔表达式的逻辑运算用括号分隔。

       如果其中的元素是字符串,当然也可以用上述的方式狗率,但是如果过滤条件比较复杂,则可以用Series.str.contains(patcase=Trueflags=0na=nanregex=True)方法来过滤。

       Series.str.contains(patcase=Trueflags=0na=nanregex=True)是Series的方法,其中参数pat是字符串,如果令参数regex为True,则pat就是正则表达式,可以利用python的正则表达式语法进行过滤。还可以令flags=re.IGNORECASE忽略大小写。当然,这些参数还有其他各种功能,可以查看相关文档获取更多内容http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.str.contains.html

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值