python中文乱码

最新推荐文章于 2022-07-07 21:54:19 发布

flyhorse1010

最新推荐文章于 2022-07-07 21:54:19 发布

阅读量147

点赞数

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/flyhorse1010/article/details/109547681

版权

1、print 乱码引入#coding:utf-8

2、raw_input提示乱码

raw_input(u'中文'.encode('gb2312'))

3、raw_input输入内容乱码

把上面的补充一下

print raw_input(u'中文'.encode('gb2312')).decode('gb2312')

4、读取文件内容乱码
print open('test1.txt','r').read().decode('utf-8').encode('gb2312');

注意：utf-8中文字符3个字节，ascii字符1个字节，在read指定数量的字符有可能失败

5、这行语句返回True

"不知道".decode("utf-8")==u'不知道' #true

6、查看中文字符串的unicode16进制格式

u'不知道'.encode("unicode_escape")

依据第5条，也可以是

'不知道'.decode('utf-8').encode("unicode_escape")

7、想知道中文字符串用的是哪种编码？
先安装python的编码检测插件chardet，再调用：

import chardet

print chardet.detect("不知道")

#返回格式如{'confidence': 0.7525, 'language': '', 'encoding': 'utf-8'}

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python中文乱码

1、print 乱码引入#coding:utf-82、raw_input提示乱码raw_input(u'中文'.encode('gb2312'))3、raw_input输入内容乱码把上面的补充一下print raw_input(u'请说说你的想法'.encode('gb2312')).decode('gb2312')
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。