爬虫-lxml-2

构建出完整的html文档,会自动对html补全:print(etree.tostring(html).decode())

返回Element节点树,是类:print(type(html))

使用“//”返回一个列表,每一个元素都是一个element类型:result = html.xpath("//li/a/text()")

获得元素的属性值:result = html.xpath("//li/@class")

根据属性值获取元素内容:result = html.xpath("//li/a[@href='link1.html']/text()")

“//”返回使用匹配的:result = html.xpath("//li//span/text()")

查找li标记下最后一个a标记的href值:result = html.xpath("//li[last()]/a/@href")

——————————————————————————————————

例:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值