ASCII、宽字符集、Unicode

原创 2006年06月10日 12:05:00

      在计算机中用的最广的就是ASCII字符。实际上字符编码还要追述到更久,比如说电报的编码,这只是其中之一,由于这是历史问题,我就不说了。在早期,ASCII的编码有三个争论的焦点,一种是用6位来表示,一种是7位,另外就是8位,最有可能的就是8位,因为计算机一个字节就是8位,可是由于价格太高,只能放弃,6位则可能由于当时有一种交换码是6位,所以选择了7位,这是真正的美国标准,一共128个字符,其优点就不说了。由于世界上不光是美国的字符,还有其他的的语言和文字,如汉字,希腊字符,所以ASCII是不能满足需要的,后来有扩展的8位的,如ANSI字符集,而且还行成了一个标准,但还是不能满足,如汉字是占2个字节的,后来就出现了宽字符集,有的字符是占一个字节,有的占两个字节,可是处理是不方便的,难度是可想而知的。于是,Unicode冲出江湖。

     Unicode用16位代表一个字符,一共有65535个,可一覆盖所有的字符,但是对编程又有了一定的影响,在Windows 98中是不支持Unicode的,而Windows NT又支持Unicode,在编写代码的时候就要明确在哪个平台下,而且移植性又不好,所以(待续)

 

版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

字符集编码详解【ASCII 、GB2312、GBK、GB18030、unicode、UTF-8】(转)

ASCII字符集编码      ASCII码是7位编码,编码范围是0x00-0x7F。ASCII字符集包括英文字母、阿拉伯数字和标点符号等字符。其中0x00-0x20和0x7F共33个控制字符。...

字符集编解码的故事(ASCII,ANSI,Unicode,Utf-8)

转自http://www.cnblogs.com/KevinYang/archive/2009/01/31/1381570.html 很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合...

常用字符集编码详解:ASCII 、GB2312、GBK、GB18030、UTF-8、unicode

ASCII ASCII码是7位编码,编码范围是0x00-0x7F。ASCII字符集包括英文字母、阿拉伯数字和标点符号等字符。其中0x00-0x20和0x7F共33个控制字符。 只支持AS...

字符集(ASCII ANSI UNICODE)与字符编码 (UTF-8 UTF-16)

字符集(ASCII ANSI UNICODE)与字符编码 (UTF-8 UTF-16)本文来自网络: 字符集ANSI的由来 字符集UNICODE的由来 编码格式UTF ANSI与UNICODE代码编写...

ASCII 、GB2312、GBK、GB18030、UTF-8、unicode 字符集编码详解

ASCII ASCII码是7位编码,编码范围是0x00-0x7F。ASCII字符集包括英文字母、阿拉伯数字和标点符号等字符。其中0x00-0x20和0x7F共33个控制字符。 只支持ASC...

常用字符集编码详解:ASCII 、GB2312、GBK、GB18030、unicode、UTF-8

ASCII     ASCII码是7位编码,编码范围是0x00-0x7F。ASCII字符集包括英文字母、阿拉伯数字和标点符号等字符。其中0x00-0x20和0x7F共33个控制字符。   ...

GB2312、GBK、GB18030 、UTF-8、Unicode、ASCII这几种字符集的主要区别是什么?

很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的万物。他们看到8个开关状态是好的,于是他们把这称为”字节“。再后来,他们又做了一些可以处理这些字节的机器,机器开...

常用字符集编码详解:ASCII 、GB2312、GBK、GB18030、UTF-8、unicode

ASCII  ASCII码是7位编码,编码范围是0x00-0x7F。ASCII字符集包括英文字母、阿拉伯数字和标点符号等字符。其中0x00-0x20和0x7F共33个控制字符。 只支持AS...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)