2021-05-21

最新推荐文章于 2022-02-24 13:31:38 发布

weixin_58051802

最新推荐文章于 2022-02-24 13:31:38 发布

阅读量43

点赞数

本文链接：https://blog.csdn.net/weixin_58051802/article/details/117132946

版权

具体使用
- 实例化一个etree对象，且需要将被解析的页面源码数据加载到该对象中
- 调用etree对象中的xpath方法结合着xpath表达式实现标签的定位和内容的捕获
如何实例化一个etree对象
1. 将本地的html文档中的源码数据加载到etree对象中：
  
  etree.parse(filePath)
2. 可以将从互联网上获取的源码数据加载到该对象中
  
  etree.HTML('page_text')
xpath表达式:
- /:表达的是从根节点开始定位，表示的是一个层级
- //：表示多个层级，可以表示从任意位置开始定位
- 属性定位：//div[@class=""] # tag[@attrName="attrValue"]
- 索引定位：//div[@class="song"]/p[3]索引是从1开始的
- 取文本：
  - /text()获取的是标签中直系的文本内容
  - //text()标签中非直系的文本内容（所有的文本内容）
- 取属性：
  - /@attrName ==>img/src

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注