C++ 检测文本文件编码格式

本文介绍了如何使用在线工具和C++代码来检测文本文件的编码类型,包括ANSI、Unicode和UTF-8,通过读取文件头的特定字节序列进行识别。
摘要由CSDN通过智能技术生成

重点:

1.在线检查工具

在线文件编码识别- 在线工具 (bugscaner.com)

2.检查文章链接

C++读取文本文件 ANSI,UNICODE,UTF-8 - 猴子你是猪吗 - 博客园 (cnblogs.com)

3.检查是否是UTF8格式

bool check_utf8_bom(const std::wstring& filename)
{
	std::ifstream file(filename, std::ios::binary);
	if (!file)
	{
		std::cerr << "Failed to open file: " << filename.c_str() << std::endl;
		return false;
	}

	// UTF-8 BOM 字节序列为 \xEF\xBB\xBF
	static constexpr char bom[] = { '\xEF', '\xBB', '\xBF' };
	char buffer[sizeof(bom)];

	file.read(buffer, sizeof(buffer));

	// 检查读取的前三个字节是否与UTF-8 BOM匹配
	return std::equal(std::begin(bom), std::end(bom), buffer);
}

3.检查ANSI = 0,Unicode= 1,UTF8,


typedef enum FileType
{
	ANSI = 0,
	Unicode= 1,
	UTF8,
}FILETYPE;



FILETYPE GetTextFileType(const std::wstring& strFileName)

{

	FILETYPE fileType = ANSI;

	std::ifstream file;

	file.open(strFileName.c_str(), std::ios_base::in);



	bool bUnicodeFile = false;

	if (file.good())

	{

		char szFlag[3] = { 0 };

		file.read(szFlag, sizeof(char) * 3);

		if ((unsigned char)szFlag[0] == 0xFF

			&& (unsigned char)szFlag[1] == 0xFE)

		{

			fileType = Unicode;

		}

		else if ((unsigned char)szFlag[0] == 0xEF

			&& (unsigned char)szFlag[1] == 0xBB

			&& (unsigned char)szFlag[2] == 0xBF)

		{

			fileType = UTF8;

		}

	}

	file.close();

	return fileType;

}

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值