C/C++
JettHuang
anybody can cook!!!
展开
-
UTF-8编码规则(转)
UTF-8是Unicode的一种实现方式,也就是它的字节结构有特殊要求,所以我们说一个汉字的范围是0X4E00到0x9FA5,是指unicode值,至于放在utf-8的编码里去就是由三个字节来组织,所以可以看出unicode是给出一个字符的范围,定义了这个字是码值是多少,至于具体的实现方式可以有多种多样来实现。 UTF-8是一种变长字节编码方式。对于某一个字符的UTF-8编码转载 2016-05-29 22:24:58 · 434 阅读 · 0 评论 -
字符集、编码和Unicode
部分来自《深入理解C++11》。 在计算机中,总是使用二进制位组合来表示复杂的信息。首当其冲需要被标识的就是字符。为了使二进制组合标识字符的方法在不同设计的计算机间通用,就迫切需要统一的字符编码方法。于是在20世纪60年代的时候,ASCII字符编码就出现了。在ANSI颁布的标准中,基本ASCII的字符使用了7个二进制位进行标识,这意味着可以标识128种不同的字符。这对英文字符(以及一转载 2016-05-29 22:23:22 · 630 阅读 · 0 评论