编码方式(II)

    在Windows上utf-8的编码都默认添加BOM头,但是也可以使用无BOM头的UTF-8来保存的,而在mac上默认的UTF-8都是无BOM的编码格式,所以代码中就会将无BOM的UTF-8判断成GBK来进行编码,所以会乱码。

    记事本打开txt文件,然后另存,有四种编码格式可供选择,编码方式和判断方法:

ANSI无格式定义对于中文编码格式是GB2312
Unicode文本里前两个字节为FF FE字节流是little endian
Unicode big endian文本里前两个字节为FE FF字节流是big  endian
UTF-8前两字节为EF BB,第三字节为BF带bom
#include <fstream>
using namespace std;
int main()
{
	ifstream fin("read.cpp",ios::binary);
	unsigned char  s2;
	fin.read((char*)&s2, sizeof(s2));//读取第一个字节,然后左移8位
	int p = s2<<8;
	fin.read((char*)&s2, sizeof(s2));//读取第二个字节
	p +=s2;
	string code;
	switch(p)//判断文本前两个字节
	{
	case 0xfffe:  //65534
		code = "Unicode";    
		break;
	case 0xfeff://65279
		code = "Unicode big endian";
		break;
	case 0xefbb://61371
		code = "UTF-8";     
		break;
	default: 
		code = "ANSI"; 
	}
	fin.close(); 

	cout<< code << endl;
	return 0;
}

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值