计算机的字符与编码集

一、字符编码集的历史
ASCII码
使用7个bits就可以完全表示ASCII码
包含95个可打印字符
33个不可打印字符(包含控制字符)
95 + 33 = 128 =2^7
在这里插入图片描述
ASCII码早期可以满足英美等国家的科学家使用,但随着计算机的发展与推广,很多应用或者国家中的符号都无法用ASCII表示,如数学符号(÷、≥、≠、≈、π)等。所以就有了第一次对ASCII码进行扩充,由7bits扩充到8bits,就是Extended ASCII码,扩展了常见数学运算符、带音标的欧洲字符、其它常用符,表格符等。
字符编码集的国际化的原因:
欧洲、东亚、中亚、拉丁美洲等国家的语言多样性。
还有语言体系不一样,不以有限字符组合的语言。
其中中日韩等的语言最为复杂。
二、中文编码集
GB2312 全称为《信息交换用汉字编码字符集——基本集》,一共收录了7445个字符,包括6763个汉字与682个其它符号。
GBK 全程为《汉字内码扩展规范》,向下兼容GB2312,向上支持国际ISO标准。收录了21003个汉字,支持全部中日韩汉字。
GBK虽然很规范和全面,但是如果我们使用GBK来开发一个中文网站放到外国使用的话,外国的用户电脑上没有安装GBK编码集,网站的内容是无法正常显示的。
Unicode:统一码,万国码,单一码。兼容全球的字符集
Unicode定义了世界通用的符号集,UTF-*实现了编码。
UTF-8以字节为单位对Unicode进行编码。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值