Python 学习随笔以及爬虫基本入门,设置随机UA等
正则
1. ^ 表示起始点
2. $ 表示结尾
3. {} 表示内容重复几次,用逗号隔开.?取非贪婪.
4. ^ 取非
5. () 表示一组
正则方法
1. re.findall()
2. re.sub()
实用样例
# 匹配每条段子里无用字符部分,并替换为空:
# \s 表示空白符,如果空格、换行符等
# &.*?; 表示 HTML实体字符,如 等
# <.*?> 表示 标签,如 <p> 、 <\br> 等
# 或者 u"
原创
2022-04-03 21:55:14 ·
502 阅读 ·
0 评论