文本在该文件下
html = etree.HTML(text)
文本单独一个软件
htmll=etree.parse('./xpath.html',etree.HTMLParser())
配合xpath使用
alll= htmll.xpath('//li/a')
//表示多个层级
//div[@class='song]属性定位
//div[@class='song]/p[3]索引定位(从1开始)
/text()取文本
//text()取非直系文本
/@src取属性
xpath返回的是列表
alll= htmll.xpath('//li/a')[0]
表示取第一个元素
BS4的使用
from bs4 import BeautifulSoup
soup = BeautifulSoup(html, 'lxml')