浅谈计算机中编码方式

本文探讨了计算机中汉字编码的两种形式——国标码和机内码,以及ASCII编码在英文字符中的应用。还介绍了Unicode编码及其UTF-8、UTF-16等实现方式,以及在不同设备上的字节顺序差异。在Web编程中,正确设置字符编码至关重要,如HTML中的meta标签和PHP中的header函数。
摘要由CSDN通过智能技术生成

所谓计算机编码,就是将通用的语言转换为能在计算机交流的语言。

1. 汉字编码

汉字编码分两种,国标码,机内码。

 (1)国标码,即GB2312-80在国标码的字符集中,收集了一级汉字3755个,二级汉字3008个,图形符号682个,共7445个。一个汉字对应一个区位码,由四位数字组成,前两位数字(0-94),为区码,后两位(0-94)为位码。

  (2) 机内码是指汉字在计算机中的编码 ,汉字的机内码占两个字节,分别称为机内码的高位与低位。它们与区位码的关系如下:机内码高位=区码+A0H ,机内码低位=位码+A0H。 汉字字库是由所有汉字的字模信息构成的。一个汉字字模信息占若干字节,究竟占多少个字节由汉字的字形决定。例如,如果用16×16点阵表示一个汉字,则一个汉字占16行,每行有16个点,在存储时用两个字节存放一行上16个点的信息,对应位为"0"表示该点为"白","1"表示该点为"黑"。因此,一个16×16的汉

占2*16=32个字节。

2.英文字符编码:英文由于使用国家众多,最初标准鱼龙混杂,最后,美国有关的标准化组织出台了ASCII(American Standard Code for Information Interchange)编码,统一规定了英文常用符号用哪些二进制数来表示。ASCII是标准的单字节字符编码方案,用于基于文本的数据。

而对于我们Internet来说,各种语言都有,不仅有中文,英文,还有日文,法文等诸多语言,如果没有一种共同的编码方式,将会造成很大的不便。

附ascii表

</
二进制 十进制 十六进制 缩写 可以显示的表示法 名称/意义
0000 0000 0 00 NUL 空字符(Null)
0000 0001 1 01 SOH 标题开始
0000 0010 2 02 STX 本文开始
0000 0011 3 03 ETX 本文结束
0000 0100 4 04 EOT 传输结束
0000 0101 5 05 ENQ 请求
0000 0110 6 06 ACK 确认回应
0000 0111 7 07 BEL 响铃
0000 1000 8 08 BS 退格
0000 1001 9 09 HT 水平定位符号
0000 1010 10 0A LF 换行键
0000 1011 11 0B VT 垂直定位符号
0000 1100 12 0C FF 换页键
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

方丈的寺院

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值