http://www.peterbe.com/plog/domstripper said: lxml是一个全新的c libxml 和libxslt 绑定, 和其它绑定比较,它声称的优势是:
lxml还试图和BeautifulSoup兼容, 就是lxml.html.soupparser 模块; 目的是引人BS的容错性.
详细介绍: http://codespeak.net/lxml
===============================
评论部分:
xml的库简直太多了,一个好的xml库应该有: 简洁又实用的API, 高效, 容错性.
容错性是个挺让人头痛的问题, BeautifulSoup似乎比其它的库要强一些, 但是速度是够慢的,曾经解析过一个不大的html, 能够感觉出停顿.
- Pythonic API.
- Documented.
- Use Python unicode strings in API.
- Safe (no segfaults).
- No manual memory management!
lxml还试图和BeautifulSoup兼容, 就是lxml.html.soupparser 模块; 目的是引人BS的容错性.
详细介绍: http://codespeak.net/lxml
===============================
评论部分:
xml的库简直太多了,一个好的xml库应该有: 简洁又实用的API, 高效, 容错性.
容错性是个挺让人头痛的问题, BeautifulSoup似乎比其它的库要强一些, 但是速度是够慢的,曾经解析过一个不大的html, 能够感觉出停顿.