1、什么是Xpath
下面是度娘给出的解释:
2、Xpath常用语法
/ :一层一层地找
// :寻找当前页面所有的标签
text() :提取文本信息
@ :提取属性的内容
// :寻找当前页面所有的标签
text() :提取文本信息
@ :提取属性的内容
3、用xpath提取有道精品课网页里的app信息和下载网站(前提是要安装lxml库)
打开有道精品课网页,审查元素进行分析如下图
import urllib.request #urlopen
from lxml import etree #xpath
yuanma=urllib.request.urlopen("http://c.youdao.com/xue/web/tools.shtml")
html=yuanma.read()
selector = etree.HTML(html)
#提取四个app的应用信息
content = selector.xpath('//div[@class="content-tools ilb vat"]