为什么Linux系统默认使用utf8编码?
国际惯例,计算机是歪果仁搞出来的
因为utf8是国际编码,GBK才是中文编码,当年工信部规定国内所有中文软件必须使用GBK编码,所以造成了转码的问题,现在中国和世界接轨,基本上已经开始抛弃GBK编码。
历史原因,不同操作系统对编码没有统一的标准。Linux对非UTF-8支持很弱,这个在Windows上也一样,如果查看软件没有自动检测编码的功能,看Linux 或MacOSX 发送的文件一样可以是乱码。
打个跑题的比方,有些使用工具生成的网页形式的报告,由于没有在头部没有指明使用的编码,在不同OS的不同浏览器里显示,有的正常,有的乱码。这个例子跟操作系统对不同文件编码的兼容性,道理是一样的。
喜欢我的回答,就关注我吧!
C 中怎么读取UTF-8编码的文件?
1.windows上 默认使用的是 GBK,所以处理UTF8稍微麻烦点,甚至都不能直接显示utf8.2.任何文件都是二进制数据。3.将文件读取到的字节数组 byte[] C 里面实际上是 unsigned char[]类型,使用windows api里面的一个函数进行转换,转换成unicode 也就是 wchar_t的字符数组 —— MultiByteToWideChar4.对于wchar_t的字符,可以直接显示,也可以直接使用,因为基本上所有操作系统都支持这种编码。5.如果需要使用GBK的字符编码数组,那么使用上面函数的另一个兄弟函数——WideCharToMultiByte提示:Windows MFC里面的字符串 CStringA CAtlStringA 这些都是基于GBK的如果用CStringA保存UTF8的编码,直接输出会乱码,所以避免混淆,应该使用std::string 保存 utf8std::wstring保存 unicode。而CStringA只在调用系统API的时候临时使用而已,而不作为长久数据保存于系统中。