input python2.7_Python 2.7中使用raw_input输入中文时的编码转换

在Python 2.7中使用raw_input输入中文时,需要进行编码转换。通过decode将str转为Unicode,再用encode转为指定编码。当遇到错误如'utf8' codec can't decode byte时,可以使用sys和locale模块自动识别字符串编码。解决方法是使用`sys.stdin.encoding`或`locale.getpreferredencoding(True)`来获取编码,并在输入提示符中应用此方法。
摘要由CSDN通过智能技术生成

python中常用的交互命令是raw_input,在写脚本时可能会经常用到。他的使用方法比较简单,不清楚的可以参考:http://www.pythonclub.org/python-basic/raw-input 。今天博主在调用图灵机器人的api时被要求输入中文,如果没有经过编码处理,api就会不认得输入的是什么内容。

94eaf9c6b370822191be1a646c14132e.png

那么如何把raw_input输入的字符转成utf-8编码格式?python中可以使用decode和encode两个方法。先decode把str转成Unicode格式,然后encode把Unicode编成要求的字符串 。

decode用法:str  -> decode('the_coding_of_str') -> unicode

encode用法:unicode -> encode('the_coding_you_want') -> str

字符串是Unicode经过编码后的字节组成。decode时需要知道输入的编码格式,如果格式不对python会抛出错误,类似如下。

>>> s.decode('utf-8')

Traceback (most recent call last):

File "", line 1, in

File "C:\Python27\lib\encodings\utf_8.py", line 16, in decode

return codecs.utf_8_decode(input, errors, True)

UnicodeDecodeError: 'utf8' codec can't decode byte 0xd6 in position 0: invalid continuation byte

python 2.7中可以使用sys和locale两个模块自动识别字符串的编码。修改后的代码如下所示。

9ac31dab89cbb40e04348fc238513d1a.png

这样Python 2.7中使用raw_input输入中文时的编码转换问题应该就解决了。如果想要raw_input输入提示符也是中文,那么一样的思路,上面raw_input一行可以改成这样。

info=raw_input(u'提问:'.encode('gb18030')).decode(sys.stdin.encoding or locale.getpreferredencoding(True))

参考连接:http://wklken.me/posts/2013/08/31/python-extra-coding-intro.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值