UserWarning: This pattern is interpreted as a regular expression, and has match groups. To actually

数据处理时,需要剔出一些无用数据,在使用正则表达式进行匹配时发生警告

UserWarning: This pattern is interpreted as a regular expression, and has match groups. To actually get the groups, use str.extract.

先说结论:错误使用正则表达式的括号,使其使用了捕获组,可以无视警告不影响代码运行,或者修改正则表达式,使用非捕获组消除警告 

我的正则表达式如下:

self.pattern = r'PN\d{2}_(IN|OUT|MID)_\d+'

由于不需要使用捕获组,故需要删除括号,修改后

self.pattern = r'PN\d{2}_IN|OUT|MID_\d+'

但是这样修改后会导致正则表达式逻辑错误,因为 |(或运算符)的优先级比 _(下划线)低,所以它会错误地匹配像PN12_IN后面直接跟数字或者其他非预期字符的情况,而不会正确匹配到像 PN12_IN_12这样的字符串。

为了保持原有的匹配逻辑,需要使用非捕获组 (?:...),这样既可以避免捕获组带来的警告,又不会改变正则表达式的匹配行为。

self.pattern = r'PN\d{2}_(?:IN|OUT|MID)_\d+'

两者匹配的内容一样,但console不会再警告

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值