字符编码

字符编码
通过串口发送数据的工作流程,我们可以理解字符编码的意义
当我们的开发板通过串口向电脑发送一个字符串时,假如要发送copy这个字符串
copy这个字符串在计算机中存储的格式是一串0101的数值,43 6E 70 79
第一个字符‘c’在内存中占据一个字节来表示,也就是8位,在内存中的存储形式是0100 0011,也就是16进制的0x43
同理第二个字符’o’,在内存中的存储形式是0110 1110,也就是16进制的0x6E
第三个字符’p’,,在内存中的存储形式0111 0000,也就是16进制的0x70

这种在内存中的一个字节的0101数据,它在计算机中代表什么意义,实际上字符’c’,是我们人理解的意思,而计算机只认识0101的数据,如何把计算机中的01数据0100 0011,与我们理解的字符’c’,一一对应起来,这就是字符的编码格式,通常我们使用的字符编码格式就是ASCII。所谓的ASCII编码,就是一个字符’c’,在计算机中的存储格式(0100 0011)。

当然,编码方式肯定不止一种,ASCII只是一个8位的编码方式,也就是说它只能表示2的8次方个字符,这显然对于大多数的语言是不够用的,用中文来说,就有几千个字符,8位的ASCII肯定表示不了,因此就产生了GBK码,也就是国标码,它采用两个字节16位来表示一个中文字符。例如字符‘中’,的编码是D6 D0,这种GBK只适用于中文。

而全世界那么多的国家和民族,如何做到通用呢。
于是就引入了unicode编码,它是一种可变长的编码方式。它只是给定了一个数值所对应的字符,而没有规定这个数值是几个字节的

在这里插入图片描述例如:0x61代表字符’a’,在unicode编码表中0x61也是代表字符’a’,但是没有规定几个字节表示,0061 两个字节可以表示,00 00 61三个字节也可以表示

在这里插入图片描述这种表示unicode码的方式太浪费空间了,于是便有了UTF-8、UTF-16le 、UTF-16be的编码格式。
ASCII abc中 61 62 63 D6 D0 ASCII编码中对于中文默认国标码
UTF-16le abc中 FF FE 61 00 62 00 63 00 2D 4E
UTF-16be abc中 FE FF 00 61 00 62 00 63 其中2D 4E是unicode码,表示中字
UTF-8 abc中 EF BB BF 61 62 63 E4 B8 AD 在UTF-8中E4 B8 AD三个字节表示中字

UTF-8可变长的unicode编码格式,unicode只是一个符号集,它只规定了符号的二进制代码,却雷友规定这个二进制代码应该如何存储
而UTF-8是最常用的一种unicode的实现形式之一。

UTF-8的编码规则有两条:
1)对于单字节的字符,字节的第一位为0,后面的7位为这个字符的unicode码,因此,对于英文字母UTF-8和ASCII是相同的
1)对于n(n>1)字节的字母,第一个字节的前n位都设为1,第n+1位设为0,后面字节的前两位位10,后面的没有提及的二进制位,合起来是这个字符的unicode码

例如中字的unicode码是4E 2D

在上面的UTF-8中,中字的二进制存储是E4 B8 AD,拆开来看
11100100 10111000 10101101

第一个字节前三位为1,表示用3个字节表示此字符
第n+1位设为0,后面的两个字节前两位为10
剩下的二进制位为0100 1110 0010 1101 十六进制就是4E 2D 与unicode编码表对应。
在这里插入图片描述

字体文件
上面我们解读了数字=》代表什么 也就是字符编码的格式(charset),那么我们得到了一个字符的编码,如何把它显示出来呢
也就是说我们得到了这个字符的编码格式,我们是用宋体显示呢,还是小篆显示呢,这就是字体

在这里插入图片描述

例如:
UTF-8 中 EF BB BF E4 B8 AD 在UTF-8中E4 B8 AD三个字节表示中字

我们得到了中字的编码,那么下一步就要到字体文件中去根据这和编码,找到中字的子模或者点阵,再把它显示出来
因此字体文件中要有编码表(字符集)和字体点阵数据(字体)
在这里插入图片描述
源文件用不同的编码方式编写,会导致执行结果不一样。
怎么解决?编译程序时,要指定字符集
man gcc , /charset
-finput-charset=charset 表示源文件的编码方式, 默认以UTF-8来解析
-fexec-charset=charset 表示可执行程序里的字时候以什么编码方式来表示,默认是UTF-8

gcc -o a a.c //

gcc -finput-charset=GBK -fexec-charset=UTF-8 -o utf-8_2 ansi.c

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值