Unicode中文和英文都是占两个字节 ASCII只能存英文字母和特殊字符,占一个字节 所以,用Unicode存英文字符就会比ASCII多一倍的存储,因此就出现了一个Unicode扩展集utf-8,所有的英文字符 按ASCII存储,占一个字节,而中文变成3个字节 例子:将utf-8的编码转为gbk的编码,可以在python2.7上试 #-*- coding:utf-8 -*- s = '你好' s_to_unicode = s.decode('utf-8') s_to_gbk = s_to_unicode.encode('gbk') print(s_to_gbk)
补充_字符编码
最新推荐文章于 2021-10-13 14:53:44 发布