编码基础

原创 2012年03月28日 21:29:47

首先澄清一个概念 ASCII,ANSI标准和Unicode是一种编码,何为编码,编码的意思是为一个字符规定一个对象的数值,例如A的ASCII编码数值和Unicode数值肯定不同。至于编码对应的数值怎么存储,就不是编码所规定的范畴了。ASCII编码为0X00-0x7F Unicode从0x0000-0xFFFF,注意unicode的物理存储不一定对应一个字节哦,例如utf-8。

ANSI 美国国家标准协会,也就是说,每个国家(非拉丁语系国家)自己制定自己的文字的编码规则,并得到了ANSI认可,换句话说就是不同国家地区的ANSI编码数值是不同的。中国的ANSI编码和在日本的ANSI的意思是不一样的,中国一般是GBK,日本是JIT,香港、台湾一般是Big5。所以基于ANSI标准的语言编码,在逻辑上需要的字符数就显得不一定了,可能是一个,可能是两个,可能是三个。

搞懂了ANSI的含义,我们发现ANSI有个致命的缺陷,就是每个标准是各自为阵的,不保证能兼容。换句话说,要同时显示中文和日本文或者阿拉伯文,就完全可能会出现一个编码两个字符集里面都有对应,不知道该显示哪一个的问题,也就是编码重叠的问题。显然这样的方案不好,所以Unicode才会出现。

SBCS Single Byte Code set 意思是一个单字符字符集

MBCS 多字符字符集合,多字节字符系统或者字符集,基于ANSI编码的原理上,对一个字符的表示实际上无法确定他需要占用几个字节的,只能从编码本身来区分和解释。因此计算机在存储的时候,就是采用多字节存储的形式。也就是你需要几个字节我给你放。

DBCS 双字符字符集

可以参考这个哥们写个一片文章不错:http://blog.csdn.net/softman11/article/details/6124345

http://ycwangshuai2008.blog.163.com/blog/static/5066933120108182453397/

版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

java基础编码

  • 2013-11-06 21:53
  • 29.58MB
  • 下载

【H.264/AVC视频编解码技术详解】七、 熵编码算法(1):基础知识

熵编码概念 “熵”这一概念原本来自于化学和热力学,用于度量能量退化的指标,即熵越高,物体或系统的做功能力越低。后来香农将这一概念引入到信息论中,用于表示消息的平均信息量。信源的熵通常可以表示信源所...

字符编码、字符集基础知识一览

很多做技术的可能会有一个通病,那就是对某些高深的问题可能弄的很明白,然而对于有些基础的问题,却弄的含糊不清。或许这个行业就是这样,学的东西很多,要会的东西也很多,久而久之,一些基础的问题反而被遗忘了。...

H264视频编码基础知识.pptx

  • 2014-09-04 15:57
  • 3.64MB
  • 下载

字符编码基础

搜索、整理了一些字符编码相关的基础知识:所有的string类都是以C-style字符串为基础的。C-style字符串是字符数组。字符类型有三种编码格式:第一种是单字节字符集(single byte c...

信息论与编码理论基础

  • 2012-11-06 16:29
  • 3.21MB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)