爬虫中常用的正则表达式
爬虫中常用的正则表达式写爬虫的时候,很多时候是需要筛选数据的,可以采用的方法有正则、xpath等,个人比较习惯用正则来筛选,下面给出几个个人比较常用的正则表达式,和大家一起交流下aa(\S+?)bb"\S+"表示筛选非空的字符串,?表示非贪婪模式,根据前后文进行匹配,一般我用它来匹配一些url,这种中间不会出现空格的数据aa(\d+)bb"\d+"表示筛选数字字符串,根据前后文进行匹配,一般用来匹配一下电话号码这类数据aa(\D+)bb"\D+"表示筛选非数字字符串,一般用来匹配一些纯字母的数
原创
2021-08-02 21:44:05 ·
439 阅读 ·
0 评论