python中文代码_Python中使用中文及编码问题

python的中文问题一直是困扰新手的头疼问题,这篇文章将给你详细地讲解一下这方面的知识。当然,几乎可以确定的是,在将来的版本中,python会彻底解决此问题,不用我们这么麻烦了。

先来看看python的版本:

>>> import sys

>>> sys.version

‘2.5.1 (r251:54863, Apr 18 2007, 08:51:08) [MSC v.1310 32 bit

(Intel)]’

(一)

用记事本创建一个文件ChineseTest.py,默认ANSI:

s = “中文”

print s

测试一下瞧瞧:

E:/Project/Python/Test>python ChineseTest.py

File “ChineseTest.py”, line 1

SyntaxError: Non-ASCII character ‘/xd6’ in file ChineseTest.py on

line 1, but no encoding declared; seehttp://www.pytho

n.org/peps/pep-0263.html for

details

偷偷地把文件编码改成UTF-8:

E:/Project/Python/Test>python ChineseTest.py

File “ChineseTest.py”, line 1

SyntaxError: Non-ASCII character ‘/xe4’ in file ChineseTest.py on

line 1, but no encoding declared; seehttp://www.pytho

n.org/peps/pep-0263.html for

details

无济于事。。。

既然它提供了网址,那就看看吧。简单地浏览一下,终于知道如果文件里有非ASCII字符,需要在第一行或第二行指定编码声明。把ChineseTest.py文件的编码重新改为ANSI,并加上编码声明:

# coding=gbk

s = “中文”

print s

再试一下:

E:/Project/Python/Test>python ChineseTest.py

中文

正常咯:)

(二)

看一看它的长度:

# coding=gbk

s = “中文”

print len(s)

结果:4。

s这里是str类型,所以计算的时候一个中文相当于两个英文字符,因此长度为4。

我们这样写:

# coding=gbk

s = “中文”

s1 = u”中文”

s2 = unicode(s, “gbk”)

#省略参数将用python默认的ASCII来解码

s3 = s.decode(“gbk”)

#把str转换成unicode是decode,unicode函数作用与之相同

print len(s1)

print len(s2)

print len(s3)

结果:

2

2

2

(三)

接着来看看文件的处理:

建立一个文件test.txt,文件格式用ANSI,内容为:

abc中文

用python来读取

# coding=gbk

print open(“Test.txt”).read()

结果:abc中文

把文件格式改成UTF-8:

结果:abc涓

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值