python在打印字符串的时候会把目标串转成unicode编码,
然后在转换成平台指定的编码例如utf-8,ascii等格式。不同版本的python有默认encode方式。
python3.2:
print(sys.getdefaultencoding())
utf-8
python2.7:
print sys.getdefaultencoding()
ascii
如果encode的格式跟字符串原先的格式不同(或者说不兼容)就会出错。
UnicodeEncodeError: 'ascii' codec can't encode characters in position xx-yy: ordinal not in range(128)
由于打印的字符串时通过http请求的页面,其编码方式取决于服务器文件的编码。
所以在不指定编码方式的情况下,使用默认的方式对unicode进行编码,我用的是python2.7的版本,
运行时会去转成默认的ascii,导致上面的异常。
解决方法也很简单:
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
加上这几行就OK了。
或者直接print s.encode('utf-8')也OK