关闭

8.python中字符串的编码和解码问题——decode/encode

2024人阅读 评论(1) 收藏 举报

              python默认的是不支持中文的,要想让python识别中文,就必须在文件头加上

#-*-coding:UTF-8-*-

              这样,python默认的编码格式就会采用utf-8的格式了。

               实际工作中,我们可能会遇到需要将unicode编码形式转换到其他编码形式的问题,解决方法如下:

#-*-coding:UTF-8-*-
a_string='深入python'
by=a_string.decode('utf-8')             #因为python的编码格式已经改成了utf-8,所以,第一步就是要解码,得到解码后的对象

a=by.encode('gb18030')	             #解码后,我们就可以用其他的编码格式进行编码了,编码得到一个str对象

a=a.decode('gb18030')		    
a=a.encode('big5')
a=a.decode('big5')

 

python内部用unicode对象来表示字符串,和人交互的时候用str对象,str对象是经过了编码的对象。所以,在改变字符串编码时,必须先解码。

1
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:754707次
    • 积分:8855
    • 等级:
    • 排名:第2121名
    • 原创:108篇
    • 转载:242篇
    • 译文:3篇
    • 评论:27条
    博客专栏