20210525：Python学习——re.compile()查找数据是遇到换行

最新推荐文章于 2024-08-10 23:14:03 发布

litongya

最新推荐文章于 2024-08-10 23:14:03 发布

阅读量1.8k

点赞数

文章标签： python

本文链接：https://blog.csdn.net/litongya/article/details/117253257

版权

本文介绍了Python中使用re.compile()进行正则表达式编译，以匹配包含换行的数据。讨论了贪婪模式和非贪婪模式，并推荐在大数据量时使用finditer()代替findall()以节省内存。

摘要由CSDN通过智能技术生成

re.compile(r'<div class="sub">(.*?)</div>', re.S)  
# 被采集的数据中有多行，有换行符所以要加re.S或者re.DOTALL，换行读取数据，要不行只能读取一行，如果第一行是空格就不能采集到数据，或者采集不全。
正则表达式中'. '匹配的除'\n'以外所有字符，设置 DOTALL模式，让 . 匹配包括 '\n' 所有字符。

str.replace()可以进行简单的替换

a = 'one.txt, index.py, index.php, index.html, index.js'
a.replace('one.txt', 'index.css')
'index.css, index.py, index.php, index.html, index.js'

re.sub()可以使用正则替换

>>> import re
>>> a
'one.txt, index.py, index.php, index.html, index.js'
>>> re.sub(r'\.[a-z]+', '.csv', a)
'one.csv, index.csv, index.csv, index.csv, index.csv'

贪婪模式和费贪婪模式：

# 贪婪匹配会匹配到尽可能多的字符


>>> a
"i love 'my father' and 'my mother&#

最低0.47元/天解锁文章

litongya

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
20210525：Python学习——re.compile()查找数据是遇到换行

re.compile(r'<div class="sub">(.*?)</div>', re.S) # 被采集的数据中有多行，有换行符所以要加re.S或者re.DOTALL，换行读取数据，要不行只能读取一行，如果第一行是空格就不能采集到数据，或者采集不全。正则表达式中'. '匹配的除'\n'以外所有字符，设置 DOTALL模式，让 . 匹配包括 '\n' 所有字符。str.replace()可以进行简单的替换a = 'one.txt, index.py, i..
复制链接

扫一扫