详解 python 中文编码与处理
源代码文件中,如果有用到非ASCII字符,则需要在文件头部进行字符编码的声明
# -- coding: utf-8 --
str和unicode介绍
str和unicode都是basestring的子类 str其实是字节串 unicode才是真正的字符串
编码转换详解
可以将unicode理解为普通话, 其他编码理解为方言. 大家都理解听懂普通话,不一定听懂方言. 因此unicode必然成为中间编码. 即先将其他编码的字符串解码 (decode)成unicode,再从unicode编码(encode)成另一种编码
decode的作用是将其他编码的字符串转换成unicode编码,如 str1.decode(‘gb2312’),表示将gb2312编码的字符串转换成unicode编码
encode的作用是将unicode编码转换成其他编码的字符串,如 str2.encode(‘gb2312’),表示将unicode编码的字符串转换成gb2312编码。
博客来源: http://blog.csdn.net/juanjuel