1. 使用‘xpath’语法。应该使用‘Element.xpath’方法。来执行xpath的选择。示例代码如下:
trs = html.xpath("//tr[position()>1])
’xpath函数’返回来的永远是一个列表。
2. 获取某个标签的属性:
href = html.xpath("//a/@href")
获取a标签的href属性对应的值
3. 获取文本,是通过xpath
中的text()
函数。示例代码如下:
address = tr.xpath("./td[4]/text()")[0]
4. 在某个标签下,在执行xpath函数,获取这个标签下的子孙元素,那么应该在斜杠之前加一个点,代表是在当前元素下获取。示例代码如下:
address = tr.xpath("./td[4]/text()")[0]