# 作为一个小白,大量繁琐的正则公式和概念是不是很头痛
# 在翻阅了相关文献后,我发现对于爬虫用户来讲,常用的也就那么几个
# 好了,开始抄作业了!划重点!
# 正则表达式
# (1) 点(.) 这个符号可以匹配任意一个单一字符
# (2) 如果要匹配真正的点(.)字符,需要使用转义符 \.
# (3) 字符集([]),如 [abc] 表示三个字符可以取其中任何一个
# (4) 择一匹配符(丨),例 ab丨cd ,相当于“或”
# (5) 多个字符集写在一起,例 [ab][cd]
# (6) " * " 和 " + " ,a* 表示a出现0到n次,a+ 表示a出现1到n次
# (7) " \w " 和 " \d " , " \w " 表示任意一个字母或数字, " \d " 表示任意一个数字
# (8) [a-z] [A-Z] [0-9] , [a-z]表示26个小写字母(a~z)中的任何一个,[A-Z] [0-9]同理
# (9) 字符串中用圆括号()括起来的部分作为一组,例 (\d\d\d)-(\d\d) 有两组值
# 符号之间是可以混合使用的,往往有更丰富的结果 \d{3