lmxl 安装
支持HTML、XML解析,支持Xpath解析方式。
pip install lxml
import lxml
Beautiful Soup 安装
依赖lxml,用于从网页中提取数据。
pip install beautifulsoup4
检验
from bs4 import BeautifulSoup
soup = BeautifulSoup('<p>Hello</p>','lxml')
print(soup.p.string)
运行结果:
Hello
Pyquery 安装
和jQuery类似的语法解析HTML,支持CSS选择器。
pip install pyquery
import pyquery