Regular Expression:a approach to parse data
正则表达式字符/表达式手册:正则表达式手册
python正则表达式使用方法手册:re --- 正则表达式操作 — Python 3.10.2 文档
实在太繁琐了,感觉自己也记不住,只挑了和数据爬取有关的学习.
使用单个字符串来 描述/匹配 一系列符合某个句法规则的字符串
Eg: 验证手机号的填写规则,第一位1开头,2位以后应该是3——9或者0
这个字符串就应该是 ^标识开始 ^1(0|3|4|5|6|7|8|9)\d{9}$ $表示结束
\d 是任意数字。 {9}是允许重复的字数
在python中,我们使用的内置模块是re
一个\d只能表示一个数字,可以在后面加{数字} 表示重复可用几个数字就
\w\w\w\w\w和\w{5}是一样的
我用的匹配是手册中的
贪婪模式 :
顾名思义, .号匹配任意字符*号匹配无限多个直到最后的\d,才会给你留下你指定的最尾端的一个数字
如何防止,也就是懒惰限定符号的使用,从而获得更多数据, 在*后面加上一个?就行
.号的表示方法:
正则表达式字符/表达式手册:正则表达式手册