编码
文章平均质量分 57
coding_sloth
good good study, day day up
展开
-
ASCII详解
ASCII(发音:英语发音:/ˈæski/ ASS-kee[1],American Standard Code for Information Interchange,美国信息交换标准代码)原创 2014-09-30 17:05:51 · 1729 阅读 · 0 评论 -
UTF-8详解
UTF-8是一种变长字节的编码方式,UTF-8理论上最多可以达到6字节长,但目前全世界的字符只需要4字节就可以表示完。UTF-8是以8位(1字节)为单位对Unicode进行编码,并规定,对于某一字符的UTF-8编码,如果只有一个字节则其最高位为0;如果是多字节,则其第一字节的开头由N位连续的1加一位0组成,其他字节开头以“10”开头,剩余字节将Unicode的二进制表示从左向右填充。首字节连续原创 2014-10-08 15:44:55 · 3024 阅读 · 0 评论 -
Unicode详解
人类交流主要依靠文字、图像、声音等方式,而文字、图像、声音等信息在计算机内部是用01串这样的二进制数来表示的。文字与01串互相转换总是需要一定的规则的,总不能想怎么转就怎么转,于是Unicode等编码方式就应运而生了。刚开始的时候出现了ASCII(American Standard Code for Information Interchange,“美国信息交换标准码)编码系统。它主要用于显示现在原创 2014-09-20 22:47:17 · 1547 阅读 · 0 评论 -
区位码、国标码、机内码、GBK
1980年,为了使每个汉字有一个全国统一的代码,我国颁布了汉字编码的国家标准:GB2312-80《信息交换用汉字编码字符集——基本集》,这个字符集是目前国内所有汉字系统的统一标准。它规定了用两个字节来表示一个汉字,每个字节都只能使用低7位,共有128*128种状态,又由于ASCII中的控制代码在汉字系统中也要使用,所以只剩下94*94=8836种状态用来表示国标码规定的6763个汉字和682个全角原创 2014-10-09 14:13:27 · 5365 阅读 · 0 评论