python学习--编码转换

最新推荐文章于 2022-05-08 16:00:26 发布

lcr_happy

最新推荐文章于 2022-05-08 16:00:26 发布

阅读量357

点赞数

分类专栏： Python 文章标签： python

本文链接：https://blog.csdn.net/lcr_happy/article/details/53930178

版权

Python 专栏收录该内容

24 篇文章 1 订阅

订阅专栏

1、Python编码转换

在python2.7中，一般我们在编辑代码时默认的是utf-8编码方式，但是我们如果希望输出中文的话就需要做相应的处理。我们通过以下的例子来说明：
例如：我们要打印输出“我爱中国”这四个字

# -*- coding：utf-8 -*-
#我们先这样写
print('我爱中国')

执行代码之后我们会发现是这样的结果：

这里写图片描述

原因是因为在解释器下采用的是GBK编码方式，我们可以在cmd界面下单击右键点击属性查看。

这里写图片描述

因此我们要做些改动。事实上，utf-8,unicode和gbk三者的关系是这样。

这里写图片描述

改动之后的代码是这样：

# -*- coding:utf-8 -*-

#默认为utf-8格式
temp = "我爱中国"
#把utf-8格式解码到Unicode格式
temp_unicode = temp.decode('utf-8')
#上一句实现的是将temp解码（decode）为Unicode格式,括号里面utf-8表示的是temp的格式
#再把Unicode格式编码成gbk格式
temp_gbk=temp_unicode.encode('gbk')
#上一句实现的是将temp_unicode编码成gbk格式，括号里面的gbk代表的是要转化成的格式
print(temp_gbk)

输出结果为：

这里写图片描述

这里需要注意的还有两点：

对于Python 2.7来说，可以直接将Unicode给终端，微软系统会自动识别Unicode并将其转化成gbk再打印输出。

# -*- coding:utf-8 -*-

#默认为utf-8格式
temp = "我爱中国"
#把utf-8格式解码到Unicode格式
temp_unicode = temp.decode('utf-8')

print(temp_unicode)

对于Python 3.5来说，可以直接从utf-8格式编码到gbk格式，这就相当于Python3.5内部自动将utf-8格式转化成Unicode再转化成gbk格式，因而在Python 3.5中，Unicode这一格式已经被移除了。

# -*- coding:utf-8 -*-

#默认为utf-8格式
temp = "我爱中国"
#系统内部自动实现从utf-8>-unicode>-gbk的转换
temp_gbk = temp.encode('utf-8')

print(temp_gbk)

lcr_happy

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录