立即学习:https://edu.csdn.net/course/play/26899/344223?utm_source=blogtoedu
1、正则表达式re和XPath都是用于正则的提取,re的功能更强大;
2、XPath语法
3、提取CSDN官网的一级分类和二级分类的XPath代码:
一级分类://h3[@class=”classify_c_h3”]/a/text()
二级分类://div[@class=”classify_list”]/span/a/text()
//div[contain( @class,”classify_list”)]/span/a/text()