大端、小端序和BOM(byte order mark)

版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/wangjun5159/article/details/49178305

在多字节数据存储中,

大端,高位存储在内存地址的低位
小端,低位存储在内存地址的低位
比如,0x11 24 33 44这个数,大端、小端分别如下







为什么会有大小端序?
大端小端序与硬件cpu相关,有的cpu将高位存储在低位内存,有的cupu将低位存储在低位内存。比如 0x 1d 2a,有两种存储方案1d在低位,2a在高位,那就是大端序。1d在高位,2a在低位,那就是小端序。


通常来说x86结构(windows、linux )的都是小端序,mac是大端序。


正因为有了大端序、小端序所以,才会有BOM

bom
bom全称byte order mark,字节顺序标记。bom用在文件的开头,标记编码方案、标记大小端序。


bom作用:
1、标志编码方案,比如,utf8的bom是 0x ef bb bf ,utf16的bom是FEFF,
2、标志大小端序,"多字节为编码单元"的编码方案都会存在大小端问题,比如utf16存在大小端序的问题,如果bom是FEFF,则表示大端序,如果bom是FFFE,则表示小端序。


unicode完整的BOM

UTF编码
Byte Order Mark (BOM)
UTF-8 without BOM
UTF-8 with BOM
EF BB BF
UTF-16LE
FF FE
UTF-16BE
FE FF
UTF-32LE
FF FE 00 00
UTF-32BE
00 00 FE FF

参考unicode 字节序


展开阅读全文

没有更多推荐了,返回首页