爬虫 结构化 数据 非结构化数据 XPath lxml 类库
背景
使用正则表达式比较费劲 可以使用xpath
先将 HTML文件 转换成 XML文档,然后用 XPath 查找 HTML 节点或元素。
什么是XPath?
XPath (XML Path Language) 是一门在 XML 文档中查找信息的语言,可用来在 XML 文档中对元素和属性进行遍历。
W3School官方文档:http://www.w3school.com.cn/xpath...
原创
2018-06-22 16:24:47 ·
246 阅读 ·
0 评论