文件编码格式

最新推荐文章于 2024-05-02 12:27:44 发布

冬天下雪啦

最新推荐文章于 2024-05-02 12:27:44 发布

阅读量1.7k

点赞数

分类专栏： # 奇奇怪怪的问题文章标签： html5 css html

本文链接：https://blog.csdn.net/wutrg1502/article/details/120785773

版权

奇奇怪怪的问题专栏收录该内容

25 篇文章 0 订阅

订阅专栏

用记事本打开任意文本文件，并且另存为，就能够在编码这里看到一个下拉。
        ANSI 这个不是ASCII的意思，而是采用本地编码的意思。如果你是中文的操作系统，就会使GBK，如果是英文的就会是ISO-8859-1
        Unicode UNICODE原生的编码方式
        Unicode big endian 另一个 UNICODE编码方式
        UTF-8 最常见的UTF-8编码方式，数字和字母用一个字节，汉字用3个字节。

带有BOM的UTF-8 ：

UTF-8 不需要 BOM，尽管 Unicode 标准允许在 UTF-8 中使用 BOM。
所以不含 BOM 的 UTF-8 才是标准形式，在 UTF-8 文件中放置 BOM 主要是微软的习惯（顺便提一下：把带有 BOM 的小端序 UTF-16 称作「Unicode」而又不详细说明，这也是微软的习惯）。
BOM（byte order mark）是为 UTF-16 和 UTF-32 准备的，用于标记字节序（byte order）。微软在 UTF-8 中使用 BOM 是因为这样可以把 UTF-8 和 ASCII 等编码明确区分开，但这样的文件在 Windows 之外的操作系统里会带来问题。[摘自知乎大佬]

BOM即byte order mark ,中文名译作“字节顺序标记”。在UCS 编码中有一个叫做 “Zero Width No-Break Space” ，中文译名作“零宽无间断间隔”的字符，它的编码是 FEFF。而 FEFF 在 UCS 中是不存在的字符，所以不应该出现在实际传输中。UCS 规范建议我们在传输字节流前，先传输字符 “Zero Width No-Break Space”。这样如果接收者收到 FEFF，就表明这个字节流是 Big-Endian 的；如果收到FFFE，就表明这个字节流是 Little- Endian 的。因此字符 “Zero Width No-Break Space” （“零宽无间断间隔”）又被称作 BOM。UTF-8 不需要 BOM 来表明字节顺序，但可以用 BOM 来表明编码方式。字符 “Zero Width No-Break Space” 的 UTF-8 编码是 EF BB BF。所以如果接收者收到以 EF BB BF 开头的字节流，就知道这是 UTF-8编码了。Windows 就是使用 BOM 来标记文本文件的编码方式的。[摘自csdn大佬]

冬天下雪啦

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
文件编码格式

用记事本打开任意文本文件，并且另存为，就能够在编码这里看到一个下拉。ANSI这个不是ASCII的意思，而是采用本地编码的意思。如果你是中文的操作系统，就会使GBK，如果是英文的就会是ISO-8859-1UnicodeUNICODE原生的编码方式Unicode big endian另一个 UNICODE编码方式UTF-8最常见的UTF-8编码方式，数字和字母用一个字节，汉字用3个字节。带有BOM的UTF-8 ...
复制链接

扫一扫