Python代码文件的编码

最新推荐文章于 2024-08-07 22:04:37 发布

uri_yang

最新推荐文章于 2024-08-07 22:04:37 发布

阅读量268

点赞数

分类专栏： python

python 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

Python代码文件的编码

Python解释器会使用某种编码方式来解释Python源代码文件，默认情况下，这种编码方式就是ASCII。

Python2.1版本，在Python源码文件中，只能以以基于Latin-1的“转义unicode”的方式来书写Unicode字符，这对于亚洲的程序员是很不友好的。解决该问题的方法是，在源码文件的顶部，使用某种特殊的注释方式来表明源码文件的编码。

为了表明源码文件的编码，这种特殊的注释必须位于源码文件的第一行或第二行，类似于：

#coding=
或：

#!/usr/bin/python

-- coding: --

或：

#!/usr/bin/python

vim: setfileencoding= :

这种方式的本质是：文件的第一行或第二行必须能匹配正则表达式：
” coding[:=]\s*([-\w.]+)”，该表达式中的group1就会被解释为编码名称，如果Python无法识别该编码，则在编译时就会报错。

像Windows这样的平台，会在Unicode文件的最开始加上BOM字节码，UTF-8文件的字节码是：”xef\xbb\xbf”。为了兼容这种方式，包含这种字节码的文件，即使没有字节编码注释，也会被解释为”utf-8”。如果一个源码文件，既有编码注释，又有UTF-8的BOM字节码，则在编码注释中的编码名称只能是”utf-8”（”utf8”都不行），否则会报错：

“SyntaxError: encodingproblem: utf-8”。

作者：gqtcgq
来源：CSDN
原文：https://blog.csdn.net/gqtcgq/article/details/47068817
版权声明：本文为博主原创文章，转载请附上博文链接！

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。