知识点:
- xpath导入
- xpath语法
知识点说明:
1.xpath导入:
import reuqests #导入requests包,获取源代码
from lxml import html #xpath在lxml中
import json #pthon对象与json对象互相转换
python不能保存字典,需要通过json.dumps()转换成字符串进行保存。
json.loads()转换成python对象格式。
2.xpath语法:
表达式 | 描述 |
---|---|
nodename | 选取此节点的所有子节点。 |
/ | 从根节点选取(取子节点)。 |
// | 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置(取子孙节点)。 |
. | 选取当前节点。 |
.. | 选取当前节点的父节点。 |
@ | 选取属性。 |
data.xpath('//a') #选取路径下所有a标签子节点
data.xpath('/b') #从b标签下开始选取
data.xpath('./c') #选取当前节点下c标签(当前节点为data已经获取的节点)
data.xpath('./c[num]') #选取第num个c标签
data.xpath('./c[@d]') #选取c标签下d属性的节点