input python2.7_Python 2.7中使用raw_input输入中文时的编码转换

最新推荐文章于 2022-07-15 18:05:27 发布

weixin_39997173

最新推荐文章于 2022-07-15 18:05:27 发布

阅读量210

点赞数

文章标签： input python2.7

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39997173/article/details/115065678

版权

在Python 2.7中使用raw_input输入中文时，需要进行编码转换。通过decode将str转为Unicode，再用encode转为指定编码。当遇到错误如'utf8' codec can't decode byte时，可以使用sys和locale模块自动识别字符串编码。解决方法是使用`sys.stdin.encoding`或`locale.getpreferredencoding(True)`来获取编码，并在输入提示符中应用此方法。

摘要由CSDN通过智能技术生成

python中常用的交互命令是raw_input，在写脚本时可能会经常用到。他的使用方法比较简单，不清楚的可以参考：http://www.pythonclub.org/python-basic/raw-input 。今天博主在调用图灵机器人的api时被要求输入中文，如果没有经过编码处理，api就会不认得输入的是什么内容。

那么如何把raw_input输入的字符转成utf-8编码格式？python中可以使用decode和encode两个方法。先decode把str转成Unicode格式，然后encode把Unicode编成要求的字符串。

decode用法：str -> decode('the_coding_of_str') -> unicode

encode用法：unicode -> encode('the_coding_you_want') -> str

字符串是Unicode经过编码后的字节组成。decode时需要知道输入的编码格式，如果格式不对python会抛出错误，类似如下。

>>> s.decode('utf-8')

Traceback (most recent call last):

File "", line 1, in

File "C:\Python27\lib\encodings\utf_8.py", line 16, in decode

return codecs.utf_8_decode(input, errors, True)

UnicodeDecodeError: 'utf8' codec can't decode byte 0xd6 in position 0: invalid continuation byte

python 2.7中可以使用sys和locale两个模块自动识别字符串的编码。修改后的代码如下所示。

这样Python 2.7中使用raw_input输入中文时的编码转换问题应该就解决了。如果想要raw_input输入提示符也是中文，那么一样的思路，上面raw_input一行可以改成这样。

info=raw_input(u'提问:'.encode('gb18030')).decode(sys.stdin.encoding or locale.getpreferredencoding(True))

参考连接：http://wklken.me/posts/2013/08/31/python-extra-coding-intro.html

weixin_39997173

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。