今天遇到了decode问题, ‘gbk’ codec can’t encode character u’\u200e’ 查阅资料得到 html = html.decode('gbk','ignore') 得到解决。