python中文开发者社区-python怎么声明中文-问答-阿里云开发者社区-阿里云

最新推荐文章于 2024-06-24 15:42:08 发布

weixin_39671631

最新推荐文章于 2024-06-24 15:42:08 发布

阅读量190

点赞数

一、使用中文字符

在python源码中如果使用了中文字符，运行时会有错误，解决的办法是在源码的开头部分加入字符编码的声明，下面是一个例子：

!/usr/bin/env python

-- coding: cp936 --

Python Tutorial中指出，python的源文件可以编码ASCII以外的字符集，最好的做法是在#!行后面用一个特殊的注释行来定义字符集：

-- coding: encoding --

根据这个声明，Python会尝试将文件中的字符编码转为encoding编码，并且，它尽可能的将指定地编码直接写成Unicode文本。

注意，coding:encoding只是告诉Python文件使用了encoding格式的编码，但是编辑器可能会以自己的方式存储.py文件，因此最后文件保存的时候还需要编码中选指定的ecoding才行。

二、中文字符的存储str = u"中文"

str

u"xd6xd0xcexc4"

str = "中文"

str

"xd6xd0xcexc4"

u"中文"只是声明unicode，实际的编码并没有变。这样子就发生变化了：str = "中文"

str

"xd6xd0xcexc4"str = str.decode("gb2312")

str

u"u4e2du6587"

更进一步：s = "中文"

s.decode("gb2312")

u"u4e2du6587"len(s)

4len(s.decode("gb2312"))

2s = u"中文"

len(s)

4s = "中文test"

len(s)

8len(s.decode("gb2312"))

6s = "中文test，"

len(s)

10len(s.decode("gb2312"))

7

可以看出，对于实际Non-ASCII编码存储的字符串，python可以正确的识别出其中的中文字符以及中文上下文中的标点符号。

前缀“u”表示“后面这个字符串“是一个Unicode字符串”，这仅仅是一个声明，并不表示这个字符串就真的是Unicode了；就好比某正太声称自己已满18岁，但实际上他的真实年龄并不确定，现在体育界年龄造假可不稀罕幺!

那么声明成u有什么作用呢？对于Python来说，只要你声明某字符串是Unicode，它就会用Unicode的一套机制对它进行处理。比方说，做字符串操作的时候会动用到内部的Unicode处理函数，保存的时候以Unicode字符（双字节）进行保存。等等。显而易见，对于一个实际上并不是 Unicode的字符串，做Unicode动作的处理，是有可能会出问题的。 u前缀只适用于你的字符串常量真的是Unicode的情况。

weixin_39671631

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python中文开发者社区-python怎么声明中文-问答-阿里云开发者社区-阿里云

一、使用中文字符在python源码中如果使用了中文字符，运行时会有错误，解决的办法是在源码的开头部分加入字符编码的声明，下面是一个例子：!/usr/bin/env python-- coding: cp936 --Python Tutorial中指出，python的源文件可以编码ASCII以外的字符集，最好的做法是在#!行后面用一个特殊的注释行来定义字符集：-- coding: encoding ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。