编码的理解

茉莉玫瑰花茶

已于 2024-08-23 20:52:02 修改

阅读量431

点赞数 5

分类专栏： C语言文章标签：数据库

于 2024-08-02 16:06:22 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Small_entreprene/article/details/140869248

版权

C语言专栏收录该内容

10 篇文章 0 订阅

订阅专栏

人类的文字信息由各种各样的符号构成

文字-----符号

这些符号是不能在磁盘或内存当中存储的，计算机最早是由老美发明出来的，内存和磁盘当中只有 0，1，严格来说内存和磁盘中只能表示整型，那么我们应该怎么表示符号--------编码

一字节8比特位：0~127

编码是值和符号的映射编码关系：

ascll编码表：

1.ASCII中的0~31为控制字符；32~126为打印字符；127为Delete(删除)命令

2.ASCll编码表本质就是英文符号和值的映射关系；

3.(核心符号26(大写)+26(小写)+10(阿拉伯数字))+常见符号，这些还有空余，早期就将这些空余用表情包来编码；

int main()
{
	char buff[] = "apple sort";
	return 0;
}

计算机并不会在底层存储apple和sort这两个单词，而是存对应的编码值：

内存存值，显示符号，打印时访问内存，有很多个字节，拿到第一个字节是97，再拿97去编码里面去查，97映射的符号是a，所以显示对应的符号，所以打印的时候就是查编码表的过程

那我们直接取值：

乱码就是值和表对不上

但是ASCll是适合老美的，编码表是来表示文字的，计算机要继续推广，我们的文化博大精深，汉族就有近10万个，从国际上来，我们需要一个比较统一的编码表：Unicod

统一码（Unicode），也叫万国码、单一码，由统一码联盟开发，是计算机科学领域里的一项业界标准，包括字符集、编码方案等；

统一码是为了解决传统的字符编码方案的局限而产生的，它为每种语言中的每个字符设定了统一并且唯一的二进制编码，以满足跨语言、跨平台进行文本转换、处理的要求；

随着发展，又给了许多方案，我们重点关注UTF-8/16/32

UTF-8可以认为还是8个比特位去对应一个符号，但是不一定是8个比特位，有可能是2个8个比特位的组合表示一个符号，是一个变长编码，兼容ASCll（比如中英混合），也就是UTF-8就是以1个字节为单位；

UTF-16就是以2个字节为单位；

UTF-16就是以4个字节为单位；

由兼容性和适用性，UTF-8比较常用

这也是为什么C++的string要设计成模板（char）（char16_t）（char32_t）

小知识：

GBK：

GBK全称《汉字内码扩展规范》（GBK即“国标”、“扩展”汉语拼音的第一个字母，英文名称：Chinese Internal Code Specification），中华人民共和国全国信息技术标准化技术委员会1995年12月1日制订，国家技术监督局标准化司、电子工业部科技与质量监督司1995年12月15日联合以技监标函1995 229号文件的形式，将它确定为技术规范指导性文件。2000年已被GB18030-2000《信息交换用汉字编码字符集基本集的扩充》国家强制标准替代。 [1]2005年GB18030-2005发布，替代了GB18030-2000。

茉莉玫瑰花茶

关注

5
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

茉莉玫瑰花茶 CSDN认证博客专家 CSDN认证企业博客

码龄1年

60: 原创

9132: 周排名

1万+: 总排名

4万+: 访问

: 等级

1773: 积分

752: 粉丝

1166: 获赞

20: 评论

1062: 收藏

私信

关注

热门文章

分类专栏

C++ 20篇
算法 1篇
C语言 10篇
习题精读 4篇
项目 1篇
数据结构 23篇
排序 11篇

最新评论

二叉搜索树
魈十三: 通过文章可以看出，博主很有耐心，技术文章不仅是对技术的坚守，更是对知识的热忱和热爱，感谢您的优质分享和坚持更文。期待着博主更加深入的剖析，为大家带来更多的技术好文。通过文章可以看出，博主很有耐心，技术文章不仅是对技术的坚守，更是对知识的热忱和热爱，感谢您的优质分享和坚持更文。期待着博主更加深入的剖析，为大家带来更多的技术好文。
二叉搜索树
如意.759: 文章布局严谨合理，内容丰富充实，实乃精品力作，支持博主！
C++多态
茉莉玫瑰花茶: 感谢大佬
C++多态
魈十三: 通过文章可以看出，博主很有耐心，技术文章不仅是对技术的坚守，更是对知识的热忱和热爱，感谢您的优质分享和坚持更文。期待着博主更加深入的剖析，为大家带来更多的技术好文。通过文章可以看出，博主很有耐心，技术文章不仅是对技术的坚守，更是对知识的热忱和热爱，感谢您的优质分享和坚持更文。期待着博主更加深入的剖析，为大家带来更多的技术好文。
环形链表习题思路
茉莉玫瑰花茶: (∗❛ั∀❛ั∗)✧*。

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。