python声明编码格式_Python 中有关中文编码解码小记

最新推荐文章于 2022-03-09 17:22:40 发布

weixin_39973009

最新推荐文章于 2022-03-09 17:22:40 发布

阅读量153

点赞数

文章标签： python声明编码格式

简单记录几点，以备后忘：

1、python 中的默认编码方式为asciiIn [1]: import sys

In [2]: sys.getdefaultencoding()

Out[2]: 'ascii'

2、设置python 中的默认编码方式In [1]: import sys

In [2]: reload(sys)

In [3]: sys.setdefaultencoding('utf-8')

In [4]: sys.getdefaultencoding()

'utf-8'

3、python 头顶部设置的编码格式 # _*_ coding: utf-8 _*_ 不会影响默认python 的默认编码格式#! /usr/bin/env python

# _*_ coding: utf-8 _*_

import sys

print sys.getdefaultencoding()

执行后的结果为 ascii 编码格式

那么python 头顶部设置的编码格式有什么作用呢?

#1、如果代码中有中文注释，就需要此声明

#2、比较高级的编辑器（比如我的emacs），会根据头部声明，将此作为代码文件的格式

#3、程序会通过头部声明，解码初始化 u"人生苦短"，这样的unicode对象，(所以头部声明和代码的存储格式要一致)

那做个测试吧：#! /usr/bin/env python

# _*_ coding: utf-8 _*_

import sys

print sys.getdefaultencoding()

#reload(sys)

#sys.setdefaultencoding('utf-8')

# 会被编码为unicode

s1 = u"这是一个测试1"

# 会被编码为ascii

s2 = "这是一个测试2"

s1.encode('gbk')

s2.encode('gbk')

print s1

print s2

以上测试结果：ascii

Traceback (most recent call last):

File "testunicoding.py", line 21, in

s2.encode('gbk')

UnicodeDecodeError: 'ascii' codec can't decode byte 0xe8 in position 0: ordinal not in range(128)

主要s2这个字符串的默认编码格式为ascii ，无法先decode 成unicode 。出了问题

将默认编码方式更改为utf-8后#! /usr/bin/env python

# _*_ coding: utf-8 _*_

import sys

print sys.getdefaultencoding()

reload(sys)

sys.setdefaultencoding('utf-8')

print sys.getdefaultencoding()

# 会被编码为unicode

s1 = u"这是一个测试1"

# 会被编码为ascii

s2 = "这是一个测试2"

s1.encode('gbk')

s2.encode('gbk')

print s1

print s2

执行结果：ascii

utf-8

这是一个测试1

这是一个测试2

weixin_39973009

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。