文章截图均来自中国大学mooc Python网络爬虫与信息提取的教程,以上仅作为我的个人学习笔记。
正则表达式的使用:
---编译:将符合表达式语法的字符串转换成正则表达式特征
- 例子1: 无穷字符串组
- 例子2:有穷加限制特点的
正则表达式的语法:
- 正则表达式常用的操作符:
- 常用实例:
- 经典正则表达式实例:
- 匹配ip地址的正则表达式:4个0-255的范围
Re库的基本使用:python的标准库
-使用 raw string 类型(原生字符类型:和字符串类型不同的就是在字符串之前加上一个小写的r)
-也可以使用string类型,但是会比较繁琐,有的时候需要转义
Re库主要的功能函数:
功能函数详细:
Re库的另外一种等价用法:
Re库的match对象:
Re库的贪婪匹配和最小匹配:默认采用贪婪匹配、加上问号变成最小匹配
单元小结: