操作系统中的大头小头字节序

最新推荐文章于 2023-07-03 18:48:20 发布

NickChen_0411

最新推荐文章于 2023-07-03 18:48:20 发布

阅读量3.1k

点赞数 1

分类专栏：操作系统

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/NichChen/article/details/89923509

版权

操作系统专栏收录该内容

0 篇文章

订阅专栏

网络字节序与主机字节序

不同的CPU有不同的字节序类型这些字节序是指整数在内存中保存的顺序这个叫做主机序

最常见的有两种

1． Little endian（小头）：将低序字节存储在起始地址

2． Big endian（大头）：将高序字节存储在起始地址

内存地址：（起始地址）低位 ------> 高位

二进制编码： 0x高位|低位

FE FF : 大头，最直观

FF FE：小头，需要颠倒

LE little-endian

最符合人的思维的字节序

地址低位存储值的低位

地址高位存储值的高位

怎么讲是最符合人的思维的字节序，是因为从人的第一观感来说

低位值小，就应该放在内存地址小的地方，也即内存地址低位

反之，高位值就应该放在内存地址大的地方，也即内存地址高位

BE big-endian

最直观的字节序

地址低位存储值的高位

地址高位存储值的低位

为什么说直观，不要考虑对应关系

只需要把内存地址从左到右按照由低到高的顺序写出

把值按照通常的高位到低位的顺序写出

两者对照，一个字节一个字节的填充进去

例子：在内存中双字0x01020304(DWORD)的存储方式

内存地址

4000 4001 4002 4003

LE 04 03 02 01

BE 01 02 03 04

例子：如果我们将0x1234abcd写入到以0x0000开始的内存中，则结果为

big-endian little-endian

0x0000 0x12 0xcd

0x0001 0x23 0xab

0x0002 0xab 0x34

0x0003 0xcd 0x12

实验：

用sublime显示汉字 “严”在ANSI，Unicode，Unicode big endian和UTF-8编码方式下对应的机器码。

ANSI： 文件的编码显示 D1 CF，这正是“严”的 GB2312 编码，这也暗示 GB2312 是采用大头方式存储的

Unicode：编码是四个字节 FF FE 25 4E，其中FF FE表明是小头方式存储，真正的编码是4E25。

Unicode big endian：编码是四个字节 FEFF 4E 25，其中FEFF表示大头方式存储，因此与直观感受一样（即：编码顺序和存储顺序相同），真正的编码即为4E25

UTF-8：编码是六个字节EF BB BF E4 B8 A5，前三个字节EF BB BF表示这是UTF-8编码，后三个E4B8A5就是严的具体编码，它的存储顺序与编码顺序是一致的。

例如：chen25陈的UTF-8编码为

同样以EF BB BF开头

资料：

https://blog.csdn.net/sunstars2009918/article/details/7274519

http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。