字符编码ASCII、ANSI、DBCS、MBCS、GB2312、GBK、GB18030、UTF-8、UTF-16、Unicode、emoji

本文介绍了字符编码的历史,从EBCDIC到ASCII,再到ANSI、DBCS、MBCS,以及中国的GB2312、GBK、GB18030。进一步探讨了Unicode和其编码格式UTF-8、UTF-16,涉及字节序、BOM和emoji。
摘要由CSDN通过智能技术生成

字符必须编码后才能被计算机处理。计算机使用的缺省编码方式就是计算机的内码。
内码是指操作系统内部的字符编码。早期操作系统的内码是与语言相关的。现在的Windows在系统内部支持Unicode,然后用代码页(code page)适应各种语言。微软一般将缺省代码页指定的编码说成是内码。

EBCDIC (Extended binary coded decimal interchange code)

IBM于1963-1964年间推出的字符编码表,根据早期打孔机式的二进化十进数(BCD)排列而成。
EBCDIC编码的英文字母不是连续排列的,中间出现了多次断续,给编程带来了一些困难。

ASCII(American standard code for iInformation interchange)

计算机是美国人发明的,他们首先要考虑的问题是,如何将二进制和英文字母(拉丁文)对应起来。ASCII编码是美国人给自己设计的。ASCII 的标准版本于1967年第一次发布,最后一次更新则是在1986 年,迄今为止共收录了128个字符。
在ASCII编码中,大写字母、小写字母和阿拉伯数字都是连续分布的,这给程序设计带来了很大的方便。ASCII编码已经成了计算机的通用标准,没有人再使用EBCDIC了,它已经消失在历史的长河中了。

ANSI、DBCS(Double-byte character set)、MBCS(Muilti-bytes)

为了扩充ASCII编码,以用于显示本国的语言,不同的国家和地区制定了不同的标准,由此产生了 GB2312、GBK、Big5(中文繁体)、Shift_JIS(日文)等各自的编码标

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值