python3 中正则表达式中遇到的问题

最新推荐文章于 2022-08-26 13:33:56 发布

杨健yj

最新推荐文章于 2022-08-26 13:33:56 发布

阅读量1.2k

点赞数

分类专栏：正则表达式文章标签：分组中文 re 正则 python

本文链接：https://blog.csdn.net/yj1556492839/article/details/79543359

版权

正则表达式专栏收录该内容

2 篇文章 0 订阅

订阅专栏

分组命名

我们知道在python正则中，使用小括号可以对内容进行分组，还可以用以下方式进行分组命名。

(?P<name>正则表达式)#name是一个合法的标识符

当然，我们可以在后续的表达式中使用命名的分组，如以下示例所示：

import re
s1='a2c.a2c'
s2='a2c.d2d'
a = re.search(r'(?P<name>\w\d\w)\.(?P=name)', s1).groups()#返回('a2c',)，只有一个元素，即只有一个分组
b = re.search(r'(?P<name>\w\d\w)\.(?P=name)', s2).groups()#会报错，因为没有匹配到内容，这是为什么呢？

s1中第二个’a2c’被替换成’d2d’，在使用命名的分组匹配时，P=name所指的规则已经不是’\w\d\w‘，而是’a2c’，所以无法匹配到s2，所以要求分组内的字符串是一模一样。我猜测是这样的。

匹配中文

中文的 unicode 编码范围主要在 [u4e00-u9fa5]，这里说主要是因为这个范围并不完整，比如没有包括全角（中文）标点，不过，在大部分情况下，应该是够用的。

import re

title = '你好，hello，世界'
pattern = re.compile(r'[\u4e00-\u9fa5]+')
result = pattern.findall(title)
print(result)#结果：['你好', '世界']

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

杨健yj

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

python中正则表达式的使用方法

10-18

Python中的正则表达式是一个强大的文本处理工具，用于匹配、查找、替换等操作。在Python中，正则表达式的操作主要通过内置的`re`模块来实现。以下是一些关键的正则表达式概念和在Python中的使用方法： 1. **匹配...

python中re.search 方法（正则表达式）

qq_42387513的博客

09-26

1139

re.search 扫描整个字符串并返回第一个成功的匹配。第二个是匹配的目标字符串，参数说明：接收两个参数，第一个是匹配的规则，

参与评论您还未登录，请先登录后发表或查看评论

Python正则表达式详解大全-re模块

HRD的博客

08-26

1044

正则表达式本身是一种小型的、高度专业化的编程语言，而在python中，通过内嵌集成re模块，程序员们可以直接调用来实现正则匹配。正则表达式模式被编译成一系列的字节码，然后由用C编写的匹配引擎执行。如：import re #第一步，要引入re模块a = re.findall("匹配规则", "要匹配的字符串") #第二步，调用模块函数以列表形式返回匹配到的字符串如：#!import re #第一步，要引入re模块。...

Python的re模块 --- 正则表达式操作

Lansonli（蓝深李）的博客

04-17

903

这个模块提供了与 Perl 语言类似的正则表达式匹配操作。模式和被搜索的字符串既可以是 Unicode 字符串 (str) ，也可以是8位字节串 (bytes)。但是，Unicode 字符串与8位字节串不能混用：也就是说，你不能用一个字节串模式去匹配 Unicode 字符串，反之亦然；类似地，当进行替换操作时，替换字符串的类型也必须与所用的模式和搜索字符串的类型一致。 正则表达式使用反斜杠...

Python【三十一】正则【二】分组:sre_constants.error: redefinition of group name ‘fir‘ as group 5； was group 2 at

sunshine77_的博客

08-03

794

问题：一个正则中不能包含相同的group name unit_re = "((?P<fir>\\d+.\\d+)(市斤|斤))|((?P<fir>\\d+)(市斤|斤))" m_s = re.search(unit_re, "90KG", flags=re.IGNORECASE) if m_s is not None: print(m_s.group()) sre_constants.error: redefinition of group name 'fir' as

java nlpir_NLPIR爱好者

weixin_31246141的博客

02-16

185

2013年2月11日Python正则初学Python，对Python的文字处理能力有很深的印象，除了str对象自带的一些方法外，就是正则表达式这个强大的模块了。但是对于初学者来说，要用好这个功能还是有点难度，我花了好长时间才摸出了点门道。由于我记性不好，很容易就忘事，所以还是写下来比较好一些，同时也可以加深印象，整理思路。由于我是初学，所以肯定会有些错误，还望高手不吝赐教，指出我的错误。1 Pyt...

Python中正则表达式的用法总结

10-17

正则表达式在文本处理方面具有极大的灵活性和实用性，掌握了Python中正则表达式的用法，对于进行字符串搜索、验证、转换等操作都将变得非常高效。这篇文章对Python中的正则表达式用法做了全面的总结，并给出了实用的...

python re模块中 (?P<name>) (?P=name) 及 \g<name> 三者的使用区别

qq_35696312的博客

07-08

2万+

测试代码一： astr1 = 'AAbb aabb' astr2 = 'aabb aabb' astr3 = 'aabb ccbb' for s in astr1,astr2,astr3: result = re.match(r'(?i)(?P<pattern>[\w]+) (?P=pattern)',s) if result != None: p...

python正则表达式一些问题_python正则表达式必知必会

weixin_39623271的博客

12-08

270

正则是做数据分析和挖掘必须要会的一种方法，会了它很多问题其实就可以高效的解决了。说一个最常用的应用场景，在文本识别中，使用正则可以快速识别出类似于qq号、广告、联系方式等内容，很简单就可以为网站文本过滤提供支持。1.正则表达式基础正则表达式有一套自己的语言系统，像人类语言一样，有几个关键字构成了它的基础语法。整理起来就是下面这几个：\表示转义，一些特殊字符有特殊的意识，加\就可实现特定的意思。比如...

Python正则表达式书写容易碰到的陷阱：\W*和\W*？匹配过程遇到的问题

老猿Python

08-23

1665

老猿在分析《Python正则表达式W+和W*匹配过程的深入分析》中的问题时，想到一个问题，如果“re.split(’(\W*)’,‘Hello，world’)”的处理如果换成非贪婪模式会怎么样，根据老猿的预测，由于在’Hello，world’中没有连续的非单词字符，因此贪婪模式处理和非贪婪模式结果应该一样，如是测试了一下看看效果： >>> re.split('(\W*)','He...

Python正则表达式re模块学习遇到的问题

老猿Python

08-20

1542

Python正则表达式处理的组是什么？

Python日常笔记（27）- 正则表达式

duchaochen的博客

03-24

532

正则表达式 在Python中需要通过正则表达式对字符串进行匹配的时候，可以使用一个模块，名字为re import re # 判断字符串中是否包含hello字符串 bool = re.match("hello", "hello world") # 如果有返回值则表示包含，没有则表示不包含 print(bool) # 判断字符串中是否包含大小写h和H字符 bool = re.match("[hH]...

详解Python正则表达式之： (?P<name>…) named group 带命名的组

热门推荐

whaoXYSH的专栏

03-27

2万+

Python 2.7的手册中的解释： (?P...) Similar to regular parentheses, but the substring matched by the group is accessible within the rest of the regular expression via the symbolic group name name. Gr

正则表达式使用中常见问题

chengyuhfs的博客

09-29

664

1. 语法问题当正则表达式中出现“++”，正则匹配会抛异常，具体原因不是很情况，好像是进入到了一个死循环当中，并在网上找到这样一段描述：++Quantifier— Matches betweenoneandunlimitedtimes, as many times as possible, without giving back 2. 效率问题写得不好的正则表达式可能会导致正则表达式引擎耗费大量的时间在回溯上，达到输入长度的指数级，在编辑正则表达式时应该尽量使用明白的规则，少使用...

python 正则表达式 \b 大坑

bitcarmanlee的博客

04-10

6388

在所有介绍正则表达式元字符的资料中，都会提到\b，表示单词边界的意思。在python里写了一段小测试代码测试一下\b:#!/usr/bin/env pythonimport redef t1(): pattern = re.compile("\bprint\b") search = pattern.search('aaa print 123 hello') if search

Python-正则表达式

qq522044637的博客

01-29

1332

python正则表达式re模块使用详解。

慕课网python里的正则表达式语法_正则表达式，详细解析一下

weixin_35797127的博客

12-29

“^”匹配字符串的开始，“$”匹配字符串的结束。小括号“()”用来指定子表达式(也叫做分组)，{n,m}表示重复n到m次。(?=exp)正向肯定预查，在任何匹配exp的字符串开始处匹配查找字符串。这是一个非获取匹配，也就是说，该匹配不需要获取供以后使用。例如，“Windows(?=95|98|NT|2000)”能匹配“Windows2000”中的“Windows”，但不能匹配“Windows3.1...

Python3中正则表达式的ASCII模式实战解析

"这篇文章深入探讨了在Python中如何使用正则表达式的ASCII模式，以便在Python3中兼容Python2时期的ASCII编码方式。" 在Python中，正则表达式是处理字符串的强大工具，它允许我们通过模式匹配来查找、替换或分割文本...