关于字符编码的收集
文章平均质量分 78
kaiming2008
这个作者很懒,什么都没留下…
展开
-
判断Unicode编码的文件
任意一个Unicode编码文件,前两个byte都是"FF","FE"据此我们在读取Unicode编码文件时,可以通过这两个头Byte来判断.原创 2008-11-25 11:47:00 · 696 阅读 · 0 评论 -
UTF-8到Unicode的编码转换
UTF-8 有以下特性: UCS 字符 U+0000 到 U+007F (ASCII) 被编码为字节 0x00 到 0x7F (ASCII 兼容). 这意味着只包含 7 位 ASCII 字符的文件在 ASCII 和 UTF-8 两种编码方式下是一样的. 所有 >U+007F 的 UCS 字符被编码为一个多个字节的串, 每个字节都有标记位集. 因此, ASCII 字节 (0x00原创 2009-02-16 19:26:00 · 1417 阅读 · 0 评论