关于正则表达式
最近学习Python爬虫,在对字符串爬取时需要使用正则算法。于是写此文章记录学习正则表达式的笔记。
其中,我主要通过阅读徐晟的《正则指引》学习。该书的豆瓣网址:https://book.douban.com/subject/10591096/
此文章适合和我一样刚刚入门Python并对爬虫感兴趣的读者。大佬们更适合阅读《精通正则表达式》:https://book.douban.com/subject/2154713/(这本书讲的更细)
好了,废话不多说,我们进入正题。
首先,我们需要了解正则表达式是什么个意思。
正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。(源:百度百科)