1.调用pyquery库,使用pq为代号,大家通用
from pyquery import pyquery as pq
2.把网页初始化
doc = pq(html)
3.过滤自己想要的内容,如果是id的话前面带#,如果是class的话前面带.如果是标签的话直接不用带
items = doc("#id")
items = doc(".class")
items = doc("tag")
4.把要取的内容一条一条的输出来,用items属性
lis = items("li").items()
5.取出a标签里的连接还有标题
for li in lis:
print(li("a").attr.href)
print(li("a").text())
6.有时候会调用remove,find等命令,大家按照实际情况使用就行