python字符转换unicode编码_Python字符编码转换Unicode和str

最新推荐文章于 2024-05-06 10:30:00 发布

weixin_39774044

最新推荐文章于 2024-05-06 10:30:00 发布

阅读量2.9k

点赞数

文章标签： python字符转换unicode编码

参考链接1：https://blog.csdn.net/VictoriaW/article/details/75314737

参考链接2：https://blog.csdn.net/sheldonwong/article/details/86684761

Unicode和str

## str 我们平时写的用引号括起来的字符串都是str类型的。

>>> x = '哈哈'

>>> x

'\xb9\xfe\xb9\xfe'

### 根据上面的打印结果，可以知道str类型的x存的其实是二进制序列，而非字符串。为什么会出现这种情况呢？我们赋给x的明明是字符串。

其实很简单，x经过了一次隐形的编码过程encode()。应该采用的是系统默认编码方案。

## unicode 如果在引号的前面加上字符u，那么我们就得到一个unicode字符串：

>>> x = u'哈哈'

>>> x

u'\u54c8\u54c8'

### unicode对象保存的是字符串本身，而非二进制序列。比如程序中的unicode字符串中包含两个U+54c8字符。

### 为了避免错误，在写入文件之前，应该用utf-8或者gbk编码方案对unicode字符串编码

>>> x = u'哈哈'

>>> x

u'\u54c8\u54c8'

>>> f = open('test.txt', 'w');

>>> x = x.encode('utf-8') #unicode -> str

>>>x

'\xe5\x93\x88\xe5\x93\x88'

>>> f.write(x)

Unicode strings can be encoded in plain strings in a variety of ways, according to whichever encoding you choose:

Unicode字符串可以用多种方式编码为普通字符串, 依照你所选择的编码(encoding):

1 #将Unicode转换成普通的Python字符串:"编码(encode)"

2 unicodestring = u"Hello world"

3 utf8string = unicodestring.encode("utf-8")

4 asciistring = unicodestring.encode("ascii")

5 isostring = unicodestring.encode("ISO-8859-1")

6 utf16string = unicodestring.encode("utf-16")

7

8

9 #将普通的Python字符串转换成Unicode: "解码(decode)"

10 plainstring1 = unicode(utf8string, "utf-8")

11 plainstring2 = unicode(asciistring, "ascii")

12 plainstring3 = unicode(isostring, "ISO-8859-1")

13 plainstring4 = unicode(utf16string, "utf-16")

14

15 assert plainstring1==plainstring2==plainstring3==plainstring4

阅读(352) | 评论(0) | 转发(0) |

weixin_39774044

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python字符转换unicode编码_Python字符编码转换Unicode和str

参考链接1：https://blog.csdn.net/VictoriaW/article/details/75314737参考链接2：https://blog.csdn.net/sheldonwong/article/details/86684761Unicode和str## str 我们平时写的用引号括起来的字符串都是str类型的。>>> x = '哈哈'>>&g...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。