利用xpath进行数据采集
使用方式有两种:
1.最基本的lxml解析方式:
from lxml import etree
doc = etree.parse('exsample.html')
2.另一种:
from lxml import html
text = requests.get(url).text
ht = html.fromstring(text)
然后就可以直接使用xpath()方法来寻找其中的元素了。
使用方式:doc.xpath(xpath)或ht.xpath(xpath)
ps:xpath不用自己写,在开发者工具查看器中右键单击你需要的元素->复制->xpath即可。