关于python中unicode和各种字符串转化的问题:
本人使用2的版本今晚做了如下操作:
>>>u=u'中文' #字符串前面加u代表用unicode的编码进行保存
>>>u.encode('hex') #这条命令出错了,不知何原因,希望大神可以帮忙解决
>>>u.encode('gb2312') #以gb2312进行编码,
'\xd6\xd0\xce\xc4'
>>>u.encode('utf-8') #以utf-8进行编码
'\xe4\xb8\xad\xe6\x96\x87'
>>>print u
中文 #正常显示
>>>print u.encode('utf-8') #正常显示
中文
>>>print u.encode('gb2312') #显示乱码
‘乱码‘
以上是编码的演示,解码用decode反推也可以
编码的过程是 str--------------->unicode--------------->str
decode encode