汉字和unicode转换
a = u’王子’
b = a.encode(‘unicode_escape’)
b.decode(‘unicode_escape’)
在python中 unicode中的type为str, gbk/utf-8的类型为byte,
unicode (utf-8,gbk之间的转换,需要先转为unicode)
utf-8 <—> unicode <—> gbk
转换例子:
a=u’王子’
#编码为utf-8
b = a.encode(‘utf-8’)
#变为gbk,先解码为unicode,再编码
wz_gbk = b.decode(‘utf-8’).encode(‘gbk’)
出现最后一行的原因是 解码得用gbk,因为编码是gbk