[Python]编码声明:是coding:utf-8还是coding=urf-8呢

原创 2013年04月03日 13:36:53

我们知道在Python源码的头文件中要声明编码方式,如果你不只是会用到ascii码,很多人都写得都有点差别:

#coding=utf-8

#coding:utf-8

#-*- coding:utf-8 -*-

那么怎样写才是有效地呢,哪些优势无效的呢? 

可以查看下http://www.python.org/dev/peps/pep-0263/的解释

粗略的看下:



概要:

    这个PEP的目的是介绍在一个Python源文件中如何声明编码的语法。随后Python解释器会在解释文件的时候用到这些编码信息。最显著的是源文件中对Unicode的解释,使得在一个能识别Unicode的编辑器中使用如FUT-8编码成为可能


怎么声明呢?

如果在Python中我们并没有声明别的编码方式,就是以ASCII编码作为标准编码方式的
为了定义源文件的编码方式,一个魔法是的声明应当被放在这个文件的第一行或者是第二行例如:
#coding=<encoding name>

或者(使用流行编辑器中的格式化方式)
#!/usr/bin/python
# -*- coding: <encoding name> -*-

或者
#!/usr/bin/python
# vim: set fileencoding=<encoding name> :

不管怎么样,这些在第一行或者第二行的声明都要符合正则表达式 
 "coding[:=]\s*([-\w.]+)"

所以我们就可以知道为什么使用冒号或者等号都可以了,如果声明的编码python不能识别就会报错


Examples

    These are some examples to clarify the different styles for
    defining the source code encoding at the top of a Python source
    file:


    1. With interpreter binary and using Emacs style file encoding
       comment:


          #!/usr/bin/python
          # -*- coding: latin-1 -*-
          import os, sys
          ...


          #!/usr/bin/python
          # -*- coding: iso-8859-15 -*-
          import os, sys
          ...


          #!/usr/bin/python
          # -*- coding: ascii -*-
          import os, sys
          ...


    2. Without interpreter line, using plain text:


          # This Python file uses the following encoding: utf-8
          import os, sys
          ...


    3. Text editors might have different ways of defining the file's
       encoding, e.g.


          #!/usr/local/bin/python
          # coding: latin-1
          import os, sys
          ...


    4. Without encoding comment, Python's parser will assume ASCII
       text:


          #!/usr/local/bin/python
          import os, sys
          ...


    5. Encoding comments which don't work:


       Missing "coding:" prefix:


          #!/usr/local/bin/python
          # latin-1
          import os, sys
          ...


       Encoding comment not on line 1 or 2:


          #!/usr/local/bin/python
          #
          # -*- coding: latin-1 -*-
          import os, sys
          ...


       Unsupported encoding:


          #!/usr/local/bin/python
          # -*- coding: utf-42 -*-
          import os, sys
          ...

以上几个例子充分说明了哪些是正确的写法,哪些是正确的写法


版权声明:本文为orangleliu (http://blog.csdn.net/orangleliu/)原创文章,自由传播,文章转载请声明, 多谢。

相关文章推荐

Python的编码注释# -*- coding:utf-8 -*-

如果要在python2的py文件里面写中文,则必须要添加一行声明文件编码的注释,否则python2会默认使用ASCII编码。 # -*- coding:utf-8 -*- 问题就来了,为什...
  • arbel
  • arbel
  • 2012年09月08日 18:50
  • 162365

python 中文编码 #-*-coding:utf-8-*-

在Python文件开头处输入两行代码: #!/usr/bin/env python #-*- coding: utf-8 -*- 第一行注释事为了告诉Linux/OS X系统,这是一个Python...

关于Python脚本开头两行的:#!/usr/bin/python和# -*- coding: utf-8 -*-的作用 – 指定

#!/usr/bin/python 是用来说明脚本语言是python的 是要用/usr/bin下面的程序(工具)python,这个解释器,来解释python脚本,来运行python脚本的。   ...

Python深入:编码问题总结

一:字符编码简介          1:ASCII          最初的计算机的使用是在美国,所用到的字符也就是现在键盘上的一些符号和少数儿个特殊的符号,一个字节所就能足以容纳所有的这些字符,实际...
  • gqtcgq
  • gqtcgq
  • 2015年07月26日 16:15
  • 4274

论#coding=utf-8的位置

1.必须要在第一行或者第二行。 2.必须要在可执行代码和中文注释的前面。 3.如果页面没有中文,那么它只是一个普通注释,位置任意都行。对的写法:#coding=utf-8 #为未为 print "...

Python的编码注释# -*- coding:utf-8 -*-

如果要在python2的py文件里面写中文,则必须要添加一行声明文件编码的注释,否则python2会默认使用ASCII编码。 [python] view plain copy...
  • weiqubo
  • weiqubo
  • 2017年04月24日 14:25
  • 1376

python中Non-UTF-8 code错误的解决办法

当python中的代码有中文时,有时会出现下图错误。解决方法就是在程序的第一行加上#coding=gbk这样程序就正确啦...

设置python的默认编码为utf8

(这部分转自南瓜小米粥的博客): 这是Python的编码问题,设置python的默认编码为utf8 python安装目录:/etc/python2.x/sitecustomize.py ...

玩转Python让人讨厌的编码问题

Python的编码问题基本是每个新手都会遇到的坎,但只要完全掌握了就跳过了这个坑,万变不离其中,这不最近我也遇到了这个问题,来一起看看吧。事情的起因是review同事做的一个上传功能,看下面一段代码,...

Python对中文字符的处理(utf-8/ gbk/ unicode)

现在在做分词的时候会处理大量有关中文字符的处理,经常输出乱码,老大让我暂时不考虑字符编码,但是为了看着爽不得不研究一下。 分词系统:NLPIR 因为不同的编译环境默认的汉字编码可能不一样,我的...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:[Python]编码声明:是coding:utf-8还是coding=urf-8呢
举报原因:
原因补充:

(最多只允许输入30个字)