一般的爬虫解析 html 用 sgmlib 或者 lxml 解析 lxml 解析速度是 BS 的 20 倍以上 http://www.crummy.com/software/BeautifulSoup/bs4/doc/