正则表达式
xpath表达式,运行效率比正则块,基于对应的标签提取信息。
/ 从顶端依次往下寻找
text() 提取文本信息
@ 提取标签属性信息
// 寻找所有的标签
标签[@属性=值] 定位某一个标签
/html/head/title/text() 提取title文本
//li[@class=值]/a/@href
正则表达式
xpath表达式,运行效率比正则块,基于对应的标签提取信息。
/ 从顶端依次往下寻找
text() 提取文本信息
@ 提取标签属性信息
// 寻找所有的标签
标签[@属性=值] 定位某一个标签
/html/head/title/text() 提取title文本
//li[@class=值]/a/@href