1、print 乱码 引入#coding:utf-8
2、raw_input提示乱码
raw_input(u'中文'.encode('gb2312'))
3、raw_input输入内容乱码
把上面的补充一下
print raw_input(u'中文'.encode('gb2312')).decode('gb2312')
4、读取文件内容乱码
print open('test1.txt','r').read().decode('utf-8').encode('gb2312');
注意:utf-8中文字符3个字节,ascii字符1个字节,在read指定数量的字符有可能失败
5、这行语句返回True
"不知道".decode("utf-8")==u'不知道' #true
6、查看中文字符串的unicode16进制格式
u'不知道'.encode("unicode_escape")
依据第5条,也可以是
'不知道'.decode('utf-8').encode("unicode_escape")
7、想知道中文字符串用的是哪种编码?
先安装python的编码检测插件chardet,再调用:
import chardet
print chardet.detect("不知道")
#返回格式如{'confidence': 0.7525, 'language': '', 'encoding': 'utf-8'}