判断一个char*是不是utf8编码

原文链接: http://www.cppblog.com/izualzhy/archive/2012/12/03/195933.html


这里我修改了一下, 纯ASCII编码的字符串也返回true, 因为UTF8和ASCII兼容


int utf8_check(const char* str, size_t length) {
	size_t i;
	int nBytes;
	unsigned char chr;

	i = 0;
	nBytes = 0;
	while (i < length) {
		chr = *(str + i);

		if (nBytes == 0) { //计算字节数
			if ((chr & 0x80) != 0) {
				while ((chr & 0x80) != 0) {
					chr <<= 1;
					nBytes++;
				}
				if ((nBytes < 2) || (nBytes > 6)) {
					return 0; //第一个字节最少为110x xxxx
				}
				nBytes--; //减去自身占的一个字节
			}
		} else { //多字节除了第一个字节外剩下的字节
			if ((chr & 0xC0) != 0x80) {
				return 0; //剩下的字节都是10xx xxxx的形式
			}
			nBytes--;
		}
		i++;
	}
	return (nBytes == 0);
}


  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在Visual Studio 2019中,经常会出现const char*类型的实参与char*类型的形参不兼容的情况。解决这个问题的方法有两种。 第一种方法是在结构体中定义char*时,在前面加上"const"修饰,即将char*改为const char*。这样做可以解决const char*和char*不兼容的问题。 另一种解决方法是在Visual Studio 2019中的项目属性中进行设置。右键点击项目名称,选择"属性",然后选择"C/C++",再选择"语言",将"符合模式"改为"否"。这样设置后,也可以解决const char*和char*不兼容的问题。 需要注意的是,在使用const修饰的char*时,需要注意该指针所指向的内存不能被修改,否则会导致编译错误。而使用#define定义的常量是不具备类型的,只是简单的字符串替换,无法进行安全检查。另外,const定义的常量在程序运行过程中只有一份拷贝,而使用#define定义的常量在内存中会有多个拷贝。 总结来说,const char*和char*不兼容的问题可以通过在定义char*时加上const修饰或在项目属性中进行设置来解决。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [VS2019 C++ const char* 类型的实参与char *类型的形参不兼容解决办法](https://blog.csdn.net/qq_42955211/article/details/113748774)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"] - *2* [C语言中判断一个char*是不是utf8编码](https://download.csdn.net/download/weixin_38686860/14866180)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"] - *3* [const char * 类型的实参与 char * 类型的形参不兼容_C++ 中的 const(指针常量与常量指针)](https://blog.csdn.net/weixin_39883906/article/details/110404405)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值