正则表达式快速入门和爬虫
正则表达式简介
正则表达式,又称规则表达式。是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
对于爬虫来说,有了它,从HTML里提取想要的信息就非常方便了。
实例引入
下面就用几个实例来看一下正则表达式去的用法。
我们可以打开正则表达式测试工具 https://regex101.com/ ,输入待匹配的文本以及相应的正则表达式,就可以得出相应的匹配结果。例如,这里输入待匹配的文本如下:
Hello,
原创
2021-03-13 15:31:08 ·
127 阅读 ·
0 评论