python
文章平均质量分 86
iteye_4121
这个作者很懒,什么都没留下…
展开
-
[转]理解python中的bytestring和unicode
编码的概念首先让我们来了解一些有关编码的背景知识。在计算机世界中的,一个字节(byte)通常有8位(bit),能表示256个字符(character)。不过当今世界不同的语言中包含的文字成千上万,一个字节所能表示的字符个数远远不能满足实际的需要,所以我们要用更多的字节来表示更多的字符。用字节来表示字符的过程称之为编码。ASCII编码共有127字符,所以每个字符可以用一个字节表示。覆盖众多西欧语...原创 2010-01-12 17:25:14 · 403 阅读 · 0 评论 -
[转]python中的字符编码
python中的unicode是一种内置类型,用来表示unicode字符串。其使用的编码方式在编译时决定,可以选择使用UCS-2或者UCS-4表示。(在gentoo linux上,可以通过ucs2这个USE flag来控制) 由于unicode是一种内置类型,对其序列化(比如存盘、通过socket发送等)时必须要先将其编码成字节序列,也即python中的st...原创 2010-01-12 17:44:11 · 142 阅读 · 0 评论