# xpath表达式:
# 1,/:表示的是从根节点开始定位。表示的是一个层级。
# 2,// :表示的是多个层级。可以表示从任意位置开始定位。
# 3,属性定位:
# //div [@class=' song' ] tag [@attrName=" attrValue" ]
# 4,索引定位:
# //div [@class="song"]/p[3] 索引是从1开始的。
# 5,取文本:
# /text()获取的是标签中直系的文本内容
# //text() 标签中非直系的文本内容(所有的文本内容)
# 6,取属性:
# /@att rName ==>img/src
如何导入xpath?
from lxml import etree
导入之前必须安装相应的库,安装包:
pip install lxml
xpath使用:
etree.parse()解析本地文件
etree.HTML()解析服务器响应文件