Python3 【正则表达式】避坑指南：15个常见错误解析

最新推荐文章于 2025-05-20 11:32:35 发布

李智 - 重庆

最新推荐文章于 2025-05-20 11:32:35 发布

阅读量884

点赞数 13

分类专栏： Python 精讲精练 - 从入门到实战文章标签：正则表达式经验分享趣味编程编程技巧干货分享

本文链接：https://blog.csdn.net/weixin_47267103/article/details/145353433

版权

Python3 【正则表达式】避坑指南：15个常见错误解析

本文摘要

在使用正则表达式时，初学者和中级用户经常会遇到一些常见错误。以下是 15 种常见的正则表达式错误、原因分析以及纠错方法。

1. 忘记转义特殊字符

错误：直接使用 .、*、+ 等元字符而未转义。

import re
pattern = r'example.com'
text = "example-com"
match = re.search(pattern, text)  # 无法匹配

原因：. 是元字符，匹配任意字符，而不是字面的点 .。
纠错：使用 \. 转义。

pattern = r'example\.com'

2. 贪婪匹配导致意外结果

错误：使用 .* 或 .+ 时匹配过多内容。

import re
pattern = r'<.*>'
text = "<div>Hello</div><p>World</p>"
match = re.search(pattern, text)  # 匹配整个字符串

原因：* 和 + 是贪婪的，会尽可能多地匹配字符。
纠错：使用非贪婪匹配 .*? 或 .+?。

pattern = r'<.*?>'

3. 忽略多行模式

错误：在多行文本中使用 ^ 或 $ 时，未启用多行模式。

import re
pattern = r'^Hello'
text = "Line1\nHello\nLine2"
match = re.search(pattern, text)  # 无法匹配

原因：默认情况下，^ 和 $ 只匹配字符串的开头和结尾。
纠错：使用 re.MULTILINE 标志。

match = re.search(pattern, text, re.MULTILINE)

4. 字符集未正确使用

错误：在字符集中未正确使用 -。

import re
pattern = r'[A-Z]'
text

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

李智 - 重庆

关注关注

13
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

常见的正则表达式错误及编程入门指南

PixelNinja的博客

10-09

438

在上面的示例中，我们定义了一个正则表达式模式，用于匹配一个或多个小写字母（[a-z]+）后跟一个或多个数字（\d+）。在上面的示例中，我们定义了一个正则表达式模式，用于匹配一个或多个小写字母（[a-z]+）后跟一个或多个数字（\d+）。在正确的模式中，我们使用了插入符号（^）来匹配以"abc"开头的字符串，使用美元符号（$）来匹配以"abc"结尾的字符串。然而，错误的边界匹配可能导致意外的结果。在正确的模式中，我们使用了加号（+）来表示前面的表达式至少匹配一次，这是描述我们想要的模式的正确方式。

Python中正则表达式匹配错误的处理

shejizuopin的博客

04-27

1106

Python中的正则表达式是一个功能强大的工具，但同时也容易出错。通过了解常见的错误类型及其产生原因，并掌握相应的处理方法，可以有效地解决正则表达式匹配错误的问题。在实际开发中，我们应该养成良好的编码习惯，仔细检查正则表达式的语法和模式，合理设计捕获组，并使用调试工具和异常处理机制来提高代码的健壮性和可维护性。希望本文的内容能够帮助读者更好地应对Python正则表达式匹配错误的问题。

参与评论您还未登录，请先登录后发表或查看评论

python contains 正则_python 正则和xpath的问题

weixin_35814475的博客

12-24

270

OPPO广告平台#first_dlg .confirm_link{display: inline-block;}.cancel_btn{height:44px;line-height:44px;text-align:center;width:100px;cursor:pointer;display:inline-block;color:#2aad6f;background:#d4eee1;marg...

正则表达式错误积累

syfly007的专栏

05-20

744

"|"的作用是分割不同的规则，而不是”或“运算符，不存在结合性，只是简单地将几个规则分开来。 tt="(ab)|(cd)(ef)|(aa)(bb)(cc)"; ("aabbcc".matches(tt)); ture ("abcdaa".matches(tt)); false ("ab".matches(tt)); ture ("cdefbb".matches

为什么 JavaScript 中的正则表达式不匹配？深入分析及实际项目代码示例

向着太阳迎着光

12-08

975

正则表达式是一个强大的工具，但在实际开发中，它的匹配行为可能因一些细节问题而未能按预期工作。常见的问题包括忘记设置标志、使用错误的正则语法、未正确处理特殊字符、未考虑全局匹配等。通过仔细检查正则表达式的写法并结合实际的调试方法，可以有效避免这些问题，确保正则表达式在项目中的顺利应用。

Python正则表达式(re模块)入门：文本匹配与提取全面指南

最新发布

记录学习的过程

05-20

1102

正则表达式是处理文本数据的强大工具，Python通过re模块提供了完整的正则表达式功能。本文详细介绍了正则表达式的基础概念、核心语法及其在数据验证、提取、清洗等场景中的应用。文章还探讨了re模块的常用函数，如match、search、findall等，并对比了它们的使用场景和性能。此外，文章深入讲解了正则表达式的高级技巧，如非贪婪匹配、前后查找断言和条件匹配，并提供了性能优化建议和最佳实践，帮助读者更高效地使用正则表达式进行文本处理。

Python正则表达式量词选择指南：懒惰与贪婪，性能对比分析

[Python正则表达式量词选择指南：懒惰与贪婪，性能对比分析](https://blog.rsquaredacademy.com/img/regex_quantifiers.png) # 1. Python正则表达式基础回顾 ## 1.1 正则表达式简介 Python通过内置的`re`模块提供...

【Python正则表达式终极指南】：5个技巧让你从新手到专家

Python正则表达式基础入门在这一章节中，我们将开始探索Python中的正则表达式的世界。正则表达式是一种强大的文本处理工具，用于搜索、匹配和操作字符串。不论你是编程新手还是有经验的开发者，了解并掌握正则...

PyCharm正则表达式错误排查指南：快速定位并解决问题

[PyCharm正则表达式错误排查指南：快速定位并解决问题](https://img-blog.csdnimg.cn/98cf429ffaf847b3ad057ce15838de5c.png) # 1. PyCharm正则表达式错误的诊断基础在编写代码时，正则表达式是进行文本匹配和操作...

Python在使用正则表达式匹配时报错：AttributeError: ‘NoneType‘ object has no attribute ‘group‘

我的博客

11-15

3731

报错原因：没有匹配到符合正则表达式的内容，但又调用了group方法。解决方法：1、如果不确定能够匹配到内容时，可以先判断，再调用group方法。 import re strs = "#53e45k" if re.match("^#\d{2}", strs): #匹配以#号加2个数字开头的字符串 contents = re.match("^#\d{2}",strs).group() print("匹配到的内容是：%s" % contents) else: print("没有匹配

正则表达式中常见问题汇总

qq_44862918的博客

03-09

1611

正则表达式常见问题汇总：一、将常规的筛选规则写好后发现只匹配到一部分数据，剩下的数据匹配不到，原因大多是由于换行导致的（在匹配的时候会按行进行匹配的，因为我们写的规则.中默认是没有\n的，所以到换行时就会以为结束。可以使用替代的方式将换行替换掉，也就是将数据全部都放在同一行，或者在规则中添加换行符即可），所以在匹配数据的时候多注意一下换行带来的这个问题二、规则中大小写问题，如果是在python中使用，可以使用re.IGNORE的方式来忽略大小写三、想匹配同的结果在相同类型的规律下，但是筛选规则只有一处

记录一个python的正则匹配不到的事情

街道口扛把子的博客

04-25

1365

昨天在改一个图片爬虫（python）的时候，遇到了一个正则表达式匹配不到的链接，这里我要去匹配“Collection”这个单词。刚开始以为是正则表达式不对，但是改了好几次还是同样的结果，去匹配其他单词，可以匹配到其他相应的链接。后来用其他网址进行尝试，“Collection”是可以匹配到的，所以判断正则没有问题。然后把html存了下来再进行反复测试。最后发现，，，是因为正则里的“.”（点...

python爬虫： re.find.all()正则时，正则表达式是正确的，但匹配不到

qq_42284355的博客

12-10

6837

检查待匹配的字符串中是否有换行符‘\n’,如果有，则需要在findall（）加上一个参数re.S。 正则表达式中，“.”的作用是匹配除“\n”以外的任何字符，也就是说，它是在一行中进行匹配。这里的“行”是以“\n”进行区分的。a字符串有每行的末尾有一个“\n”，不过它不可见。如果不使用re.S参数，则只在每一行内进行匹配，如果一行没有，就换下一行重新开始，不会跨行。而使用re.S参数以后，正...

正则表达式的汇总和几个常见问题的解答

TestGreeting的博客

04-13

677

很多不太懂正则的朋友，在遇到需要用正则校验数据时，往往是在网上去找很久，结果找来的还是不很符合要求。所以我最近把开发中常用的一些正则表达式整理了一下，在这里分享一下。给自己留个底，也给朋友们做个参考。一、校验数字的表达式数字：^[0-9]*$ n位的数字：^\d{n}$ 至少n位的数字：^\d{n,}$ m-n位的数字：^\d{m,n}$

python关于正则匹配无效问题

龍博客

12-27

3785

在linux状态下，有些在正则中的特殊字符无法看见，比如\n,一定要记得替换掉。另外一个就是字符编码的问题，要统一改成utf-8模式取匹配中文，str(xxxx).decode(‘utf-8’),在正则中则多添加一个u ，如正则’关于.宣告.’ 改成u(‘关于.宣告.‘)

正则表达式常见错误

weixin_30256901的博客

08-14

616

如果用 [0-9]* 匹配 'a 1234 num', 备用状态是否包括 'a .1234 num'(点号代表位置) ? (p.164) 答案是否定的. 星号限定的部分总是能够匹配. 如果整个表达式都由星号控制, 它就能够匹配任何内容. 在字符串的开始位置, 传动机构对引擎进行第一次尝试时的状态, 当然算匹配成功. 在这种情况下, 正则表达式匹配 '.a 1234 num', 而且在此处结...

re正则表达式之常见问题

zss041962的博客

01-17

1355

常见问题转自：http://blog.csdn.net/goodboy5201314/article/details/42642665 正则表达式是一个非常强大的工具，但在有些时候它并不能直观地按照你的意愿来运行。本篇我们将指出一些最常见的错误。1、使用字符串方法有时使用 re 模块是个错误！如果你匹配一个固定的字符串或者单个字符类，并且你没有使用 re 的任何标志（像 IGNORECASE

Python正则表达式权威指南：精通复杂特性的实战教程

"Mastering Python Regular Expressions" 是一本专为Python编程爱好者精心撰写的指南，它深入浅出地介绍了如何在Python中利用正则表达式处理复杂的文本模式。本书由 Félix López 和 Víctor Romero 联合编写，由 ...