PyQuery 让你使用 jQuery 的风格来遍历 XML 文档,它使用了 lxml 来处理 XML 乃至 HTML 文档。
你可以直接从字符串、URL或者文件中加载文档:>>> from pyquery import PyQuery as pq
>>> from lxml import etree
>>> import urllib
>>> d = pq("")
>>> d = pq(etree.fromstring(""))
>>> d = pq(url='http://google.com/')
>>> # d = pq(url='http://google.com/', opener=lambda url: urllib.urlopen(url).read())
>>> d = pq(filename=path_to_html_file)
然后使用 $ 进行遍历:>>> d("#hello")
[
]
>>> p = d("#hello")
>>> print(p.html())
Hello world !
>>> p.html("you know Python rocks")
[
]
>>> print(p.html())
you know Python rocks
>>> print(p.text())
you know Python rocks