1、decode和encode:
decode的作用是将其他编码的字符串转换成unicode编码,如str1.decode(‘gb2312’),表示将gb2312编码的字符串str1转换成unicode编码。
encode的作用是将unicode编码转换成其他编码的字符串,如str2.encode(‘gb2312’),表示将unicode编码的字符串str2转换成gb2312编码。
将unicode做中转类型
2、在中文字符前加u,表示声明后面的文字是unicode,但并不代表就是unicode编码的。python会根据这个u进行处理。
3、解决编码问题,最好的办法就是如下:
#coding:utf-8
import sys
reload(sys)
sys.setdefaultencoding("utf-8")
4、如果代码没有指定coding,python就默认所有的字符为ASCII码
参考:http://my.oschina.net/leejun2005/blog/74430
http://www.blogjava.net/pts/archive/2007/02/11/99279.html