python中文代码_Python中使用中文及编码问题

最新推荐文章于 2023-01-03 21:51:42 发布

weixin_39557797

最新推荐文章于 2023-01-03 21:51:42 发布

阅读量139

点赞数

文章标签： python中文代码

python的中文问题一直是困扰新手的头疼问题，这篇文章将给你详细地讲解一下这方面的知识。当然，几乎可以确定的是，在将来的版本中，python会彻底解决此问题，不用我们这么麻烦了。

先来看看python的版本：

>>> import sys

>>> sys.version

‘2.5.1 (r251:54863, Apr 18 2007, 08:51:08) [MSC v.1310 32 bit

(Intel)]’

（一）

用记事本创建一个文件ChineseTest.py，默认ANSI：

s = “中文”

print s

测试一下瞧瞧：

E:/Project/Python/Test>python ChineseTest.py

File “ChineseTest.py”, line 1

SyntaxError: Non-ASCII character ‘/xd6’ in file ChineseTest.py on

line 1, but no encoding declared; seehttp://www.pytho

n.org/peps/pep-0263.html for

details

偷偷地把文件编码改成UTF-8：

E:/Project/Python/Test>python ChineseTest.py

File “ChineseTest.py”, line 1

SyntaxError: Non-ASCII character ‘/xe4’ in file ChineseTest.py on

line 1, but no encoding declared; seehttp://www.pytho

n.org/peps/pep-0263.html for

details

无济于事。。。

既然它提供了网址，那就看看吧。简单地浏览一下，终于知道如果文件里有非ASCII字符，需要在第一行或第二行指定编码声明。把ChineseTest.py文件的编码重新改为ANSI，并加上编码声明：

# coding=gbk

s = “中文”

print s

再试一下：

E:/Project/Python/Test>python ChineseTest.py

中文

正常咯：）

（二）

看一看它的长度：

# coding=gbk

s = “中文”

print len(s)

结果：4。

s这里是str类型，所以计算的时候一个中文相当于两个英文字符，因此长度为4。

我们这样写:

# coding=gbk

s = “中文”

s1 = u”中文”

s2 = unicode(s, “gbk”)

#省略参数将用python默认的ASCII来解码

s3 = s.decode(“gbk”)

#把str转换成unicode是decode，unicode函数作用与之相同

print len(s1)

print len(s2)

print len(s3)

结果：

2

2

2

（三）

接着来看看文件的处理：

建立一个文件test.txt，文件格式用ANSI，内容为:

abc中文

用python来读取

# coding=gbk

print open(“Test.txt”).read()

结果：abc中文

把文件格式改成UTF-8：

结果：abc涓

weixin_39557797

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python中文代码_Python中使用中文及编码问题

python的中文问题一直是困扰新手的头疼问题，这篇文章将给你详细地讲解一下这方面的知识。当然，几乎可以确定的是，在将来的版本中，python会彻底解决此问题，不用我们这么麻烦了。先来看看python的版本：>>> import sys>>> sys.version‘2.5.1 (r251:54863, Apr 18 2007, 08:51:08) [MSC v.1310 32 bit(Intel...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。