计算机General
文章平均质量分 79
zjxsq
这个作者很懒,什么都没留下…
展开
-
关于Unicode编码的UCS、UTF、BMP、BOM等概念
这是一篇程序员写给程序员的趣味读物。所谓趣味是指可以比较轻松地了解一些原来不清楚的概念,增进知识,类似于打RPG游戏的升级。整理这篇文章的动机是两个问题:问题一:使用Windows记事本的“另存为”,可以在GBK、Unicode、Unicode big endian和UTF-8这几种编码方式间相互转换。同样是txt文件,Windows是怎样识别编码方式的呢?我很早前就发现Unicode、U转载 2008-12-14 23:15:00 · 535 阅读 · 0 评论 -
关于计算机中Endian(big-edian和little-endian)存储机制的由来、特点和区别
下面是关于Endian文章的引用:一、引子 在各种计算机体系结构中,对于字节、字等的存储机制有所不同,因而引发了计算机通信领域中一个很重要的问题,即通信双方交流的信息单元(比特、字节、字、双字等等)应该以什么样的顺序进行传送。如果不达成一致的规则,通信双方将无法进行正确的编/译码从而导致通信失败。目前在各种体系的计算机中通常采用的字节存储机制主要有两种:big-edi转载 2008-12-14 23:13:00 · 570 阅读 · 0 评论 -
UTF-8、GB2312、GB18030、GBK和BIG5等字符集编码范围的具体说明
一 预备知识1,字符:字符是抽象的最小文本单位。它没有固定的形状(可能是一个字形),而且没有值。“A”是一个字符,“€”(德国、法国和许多其他欧洲国家通用货币的标志)也是一个字符。“中”“国”这是两个汉字字符。字符仅仅代表一个符号,没有任何实际值的意义。2,字符集:字符集是字符的集合。例如,汉字字符是中国人最先发明的字符,在中文、日文、韩文和越南文的书写中使用。这也说明了字符和字符集之间的转载 2008-12-14 23:17:00 · 620 阅读 · 0 评论