核心编程上说记事本识别不同编码文件时是通过IsTextUnicode测试的。
不是这样的。不同编码的文本文件头部是不一样的。记事本通过这些头判断出属于何种编码。
Unicode头部是FF FE标志。
UTF8总是加EF BB BF。
Unicode big endian则是FE FF。
ANSI没有头。
这实际上是标准的。这些头称为BOM(byte order mask)。utf-16,utf-32也都有BOM。
FF FE在unicode中意为zero width no - break space。
不同编码的文本文件的区别
最新推荐文章于 2024-01-01 18:20:34 发布