计算机编码知识整理

小德_binary

于 2022-08-16 23:38:51 发布

阅读量1.2k

点赞数

分类专栏：计算机基础文章标签：开发语言

本文链接：https://blog.csdn.net/weixin_42993847/article/details/126376514

版权

1 篇文章 0 订阅

订阅专栏

计算机编码指电脑内部代表字母或数字的方式.

常见的编码方式有:ASCII编码,GB2312编码(简体中文),GBK,BIG5编码(繁体中文),ANSI编码,unicode,utf-8编码等

最小的单元是位(bit)，接着是字节(Byte)，一个字节=8位，英语表示是1 Byte=8 bits 。

机器语言的单位Byte。1 KB=1024 Byte; 1 MB=1024 KB; 1 GB=1024 MB ; 1TB=1024 GB。

（American Standard Code for Information Interchange，美国信息交换标准代码）长度为1字节；第一位为校验位，后七位表示英文字母及符号

长度为2字节；共 7445 个图形字符。其中包括6763个汉字，其中一级汉字3755个，二级汉字3008个;包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语西里尔字母在内的682个全角字符

GBK编码，是在GB2312-80标准基础上的内码扩展规范，使用了双字节编码方案，其编码范围从8140至FEFE（剔除xx7F），共23940个码位，共收录了21003个汉字，完全兼容GB2312-80标准

采用变长多字节编码，每个字可以由1个、2个或4个字节组成，收录汉字70,244个；兼容GB2312、基本兼容GBK支持Unicode所有码位，2023年8月1日实施强制标准；