浅谈计算机中编码方式

最新推荐文章于 2023-08-29 09:38:54 发布

方丈的寺院

最新推荐文章于 2023-08-29 09:38:54 发布

阅读量1.9k

点赞数 1

文章标签：编程语言编码 UTF-8

本文链接：https://blog.csdn.net/fs1360472174/article/details/8144530

版权

本文探讨了计算机中汉字编码的两种形式——国标码和机内码，以及ASCII编码在英文字符中的应用。还介绍了Unicode编码及其UTF-8、UTF-16等实现方式，以及在不同设备上的字节顺序差异。在Web编程中，正确设置字符编码至关重要，如HTML中的meta标签和PHP中的header函数。

摘要由CSDN通过智能技术生成

所谓计算机编码，就是将通用的语言转换为能在计算机交流的语言。

1. 汉字编码

汉字编码分两种，国标码，机内码。

（1)国标码，即GB2312-80在国标码的字符集中，收集了一级汉字3755个，二级汉字3008个，图形符号682个，共7445个。一个汉字对应一个区位码，由四位数字组成，前两位数字(0-94)，为区码，后两位（0-94）为位码。

(2) 机内码是指汉字在计算机中的编码，汉字的机内码占两个字节，分别称为机内码的高位与低位。它们与区位码的关系如下：机内码高位=区码+A0H ，机内码低位=位码+A0H。汉字字库是由所有汉字的字模信息构成的。一个汉字字模信息占若干字节，究竟占多少个字节由汉字的字形决定。例如，如果用16×16点阵表示一个汉字，则一个汉字占16行，每行有16个点，在存储时用两个字节存放一行上16个点的信息，对应位为"0"表示该点为"白"，"1"表示该点为"黑"。因此，一个16×16的汉

占2*16=32个字节。

2.英文字符编码：英文由于使用国家众多，最初标准鱼龙混杂，最后，美国有关的标准化组织出台了ASCII（American Standard Code for Information Interchange）编码，统一规定了英文常用符号用哪些二进制数来表示。ASCII是标准的单字节字符编码方案，用于基于文本的数据。

而对于我们Internet来说，各种语言都有，不仅有中文，英文，还有日文，法文等诸多语言，如果没有一种共同的编码方式，将会造成很大的不便。

附ascii表

二进制	十进制	十六进制	缩写	可以显示的表示法	名称/意义
0000 0000	0	00	NUL	␀	空字符（Null）
0000 0001	1	01	SOH	␁	标题开始
0000 0010	2	02	STX	␂	本文开始
0000 0011	3	03	ETX	␃	本文结束
0000 0100	4	04	EOT	␄	传输结束
0000 0101	5	05	ENQ	␅	请求
0000 0110	6	06	ACK	␆	确认回应
0000 0111	7	07	BEL	␇	响铃
0000 1000	8	08	BS	␈	退格
0000 1001	9	09	HT	␉	水平定位符号
0000 1010	10	0A	LF	␊	换行键
0000 1011	11	0B	VT	␋	垂直定位符号
0000 1100	12	0C	FF	␌	换页键