unicode处理中文

On Sat, 19 Mar 2005 22:21:36 +0800, python leo < python.leo@gmail.com>
wrote:
> >>> unicode('中文','cp936')
> u'/u4e2d/u6587'
> >>> print unicode('中文','cp936')
> 中文
> >>>
> 谁讲讲为什么会产生这种不同?如果想把中文输出到文件,该怎么处理?

在交互界面下,你敲完一条命令后会输出其返回值的expr(),如果返回值是None则不输出任何结果。因此:

unicode('中文','cp936')将返回一个unicode对象,u'/u4e2d/u6587'是expr(unicode('中文','cp936'))的返回值。

print
unicode('中文','cp936')这条语句将打印出"中文"两字,返回None,因此不再输出任何内容。

也就是说,u'/u4e2d/u6587'是交互界面输出的,而"中文"二字是你的命令输出的。


要想把中文输出到文件,只需要将中文unicode用你需要的编码格式编码为string,然后用file.write()或者print
>>f即可。如果你的中文字符串本来就是string格式,直接写入文件就行。

READ AFTER ME:
string对象仅仅是一堆字节,只有确认了它的编码,它才能称为"字符"串

> >>> unicode('中文','cp936')
> u'/u4e2d/u6587'
这种处理是Python自动完成的。它把计算机内部保存的数据给显示出来了。这才是真正的内容!
> >>> print unicode('中文','cp936')
> 中文
这个是打印出来的,是为了看的。是由操作系统根据编译转换成了相应的字体。如果你做过GUI程序,可以理解为将汉字使用图形函数画在屏幕上的。
> >>>

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值