- 博客(2)
- 收藏
- 关注
原创 使用python做webservice服务
import soaplibfrom soaplib.core.util.wsgi_wrapper import run_twisted #发布服务from soaplib.core.server import wsgifrom soaplib.core.service import DefinitionBase #所有服务类必须继承该类from soaplib.core.ser
2014-05-21 16:15:24 3766 1
原创 nekohtml中解析中出现中文乱码问题
后来,确认问题应该出现在nekohtml(HtmlParser默认使用的html文档解析包)身上,于是下载nekohtml查看源码,发现默认情况下,如果nekohtml在页面中找到charset的设置,他将使用页面中指定的编码集,所以大量的页面都用页面中指定的GB2312进行解析,这样如果页面中存在GB2312没有包含的字符时就会出现乱码,在HtmlScanner中有一个特征(Feature)
2014-05-05 17:37:35 1353
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人