爬虫——数据爬取-xpath解析器
Xpath
预备知识
HTML DOM 模型示例
HTML DOM 定义了访问和操作 HTML 文档的标准方法,以树型结构表示HTML 文档。
如何实现爬虫数据的解析?
1、 定位html文档中的节点
2、 提取指定节点的属性,比如href,class等
3、 获取指定节点的文本,比如a、p,div,span,div等的文本
什么是XPath?
XPath (XML Path Language)...
原创
2020-01-29 23:51:43 ·
897 阅读 ·
0 评论