1 概念
pyquery库是jQuery的Python实现,能够以jQuery的语法来操作解析 HTML 文档,易用性和解析速度都很好,和它差不多的还有BeautifulSoup,都是用来解析的。
2 常用方法
例:查找标签,打印id=container的标签:
print(doc.find('#container'))
3 CSS选择器
4 代码示例
if __name__ == '__main__':
#打开文件,读取文本,作为q的内容
q=PyQuery(open('ev.html').read())
#示例1:打印title里面的数据
print q('title').text()
#示例2:选择器.class:div中class=inner,>a表示子节点是a
for each in q('div.inner>a').items:
if each.attr.href.find('tab')>0:
#打印超链接
print each.attr.href
#示例3:选择器id=tab,>a表示子元素是a
for each in q('#tab>a').items:
#打印超链接
print each.attr.href
#示例4:空格只需要包含在cell中就行,不一定是亲子节点,可以两层三层
for each in q('.cell a[href^="/go/"]').items:
#打印超链接
print each.attr.href
注:print each.attr.href:打印超链接 print each.html():打印文本