python的str与unicode类型

参考https://blog.csdn.net/VictoriaW/article/details/75314737

首先看一段脚本:

>>> mystr = '哈哈'
>>> mystr
'\xe5\x93\x88\xe5\x93\x88'    #我用python2.7.16,str类型字符串在buffer缓存非ascii字符时自动进行unicode码 ——> UTF-8码的编码
>>> type(mystr)
<type 'str'>
>>> len(mystr)                #6个字节没错
6

>>> mystr02 = mystr.decode('utf-8')
>>> mystr02
u'\u54c8\u54c8'          #将mystr按utf-8解码得到unicode码表示的字符窜,只是一个字面量,文件IO时一般没有直接写Unicode码的
>>>

>>> import sys
>>> print(sys.getdefaultencoding())    
ascii                    #这里的编码格式有一些用途,比如不指定编码格式进行文件IO时

>>> fh = open('temp.txt','w')
>>> fh.write(mystr02)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-1: ordinal not in range(128)        #这里报错'ascii'编码不能编码不在range(128)范围的unicode字符的确,但,下面utf-8字符串就能写啊


>>> fh.write(mystr)
>>> mystr
'\xe5\x93\x88\xe5\x93\x88'

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值