Python解析Html:
一、通过正则表达式进行解析:
推荐正则表达式的一篇博客,见blog《Python正则表达式指南》。
二、通过BeautifulSoup进行解析:
写代码时很人性化,但是耗时损失较大。
官方文档。
三、通过PyQuery进行解析:
基于lxml,相对于lxml而言写代码时很人性化,类似于BeautifulSoup,同时耗时损失较小,相比于BeautifulSoup有数倍的改进。
官方文档。推荐一篇博客,见blog《Python Html解析器性能评测”》。
此处再附加一篇不错的blog《python网页解析|飞熊在天》