python解析html xml最好的模块_python中处理xml的模块哪个好?

5ed461593f6dd646.jpg

python中可以使用BeautifulSoup4或pyQuery模块处理xml文件。pyQuery模块比较适合于对CSS选择器等的支持,BeautifulSoup4模块使用简单。

Beautiful Soup 是一个用来从HTML或XML文件中提取数据的Python库,它利用大家所喜欢的解析器提供了许多惯用方法用来对文档树进行导航、查找和修改。

Beautiful Soup除了支持Python标准库中的HTML解析器外,还支持一些第三方的解析器,其中一个就是 lxml 。

PyQuery 让你使用 jQuery 的风格来遍历 XML 文档,它使用了 lxml 来处理 XML 乃至 HTML 文档。

你可以直接从字符串、URL或者文件中加载文档:>>> from pyquery import PyQuery as pq

>>> from lxml import etree

>>> import urllib

>>> d = pq("")

>>> d = pq(etree.fromstring(""))

>>> d = pq(url='http://google.com/')

>>> # d = pq(url='http://google.com/', opener=lambda url: urllib.urlopen(url).read())

>>> d = pq(filename=path_to_html_file)

更多Python知识请关注云海天python教程网

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值