首先,python 中有byte string和unicode string两种不同的类型。因此,python 里面的编码和解码也就是 unicode 和 byte 这两种形式的相互转化:编码是 unicode -> byte,解码就是 byte -> unicode。
举例:
将unicode字符集转换为gb2312字符集
u'你好'.encode('gb2312')
将输入的gb2312字符集的数据解码为unicode字符集
'你好'.decode('gb2312')
将输入的gb2312字符集的数据解码为unicode字符集,同时编码为utf8
'你好'.decode('gb2312').encode('utf8')
另外推荐一篇文章:
字符集编码详解
[url]http://www.cnblogs.com/humanchao/articles/876970.html[/url]
举例:
将unicode字符集转换为gb2312字符集
u'你好'.encode('gb2312')
将输入的gb2312字符集的数据解码为unicode字符集
'你好'.decode('gb2312')
将输入的gb2312字符集的数据解码为unicode字符集,同时编码为utf8
'你好'.decode('gb2312').encode('utf8')
另外推荐一篇文章:
字符集编码详解
[url]http://www.cnblogs.com/humanchao/articles/876970.html[/url]