多字节字符序列无效

编译成功,但提示多字节字符序列无效

编译环境 :VS 2019

报错截图:在这里插入图片描述

修改方法:

1.使用向右的双斜杠 (\\表示一个\,第一个\的作用是转义字符)      2.使用向左的单斜杠

代码修改(36~41行):

#include<stdio.h>
#include<stdlib.h>

#define BUFSIZE 1024

//实现文件的二进制拷贝
int copyfile(const char* dest, const char* src) {
	FILE* fp1 = NULL, * fp2 = NULL;
	fopen_s(&fp1, src, "rb");
	if (fp1 == NULL) {
		return -1;
	}
	fopen_s(&fp2, dest, "wb");
	if (fp2 == NULL) {
		return -2;
	}

	char buffer[BUFSIZE]; //区别BUFSIZ, BUFSIZ在stdio.h文件中已有宏定义
	int readlen, writelen;

	while ((readlen = fread(buffer, 1, BUFSIZE, fp1)) > 0) {
		writelen = fwrite(buffer, 1, readlen, fp2);
		if (readlen != writelen) {
			return -3;
		}
	}

	fclose(fp1);
	fclose(fp2);
	return 0;
}

int main() {
	int ret = 0;
	
	//法一:使用双斜杠
	//ret = copyfile("G:\\Code-Practice\\VS2019\\项目15\\P15-异常机制\\P15-异常机制\\dest.txt", "G:\\Code-Practice\\VS2019\\项目15\\P15-异常机制\\P15-异常机制\\src.txt");
	
	//法二:使用单反斜杠
	ret = copyfile("G:/Code-Practice/VS2019/项目15/P15-异常机制/P15-异常机制/dest.txt", "G:/Code-Practice/VS2019/项目15/P15-异常机制/P15-异常机制/src.txt");

	if (ret != 0) {
		switch (ret) {
		case -1:
			printf("打开原文件失败!\n");
			break;
		case -2:
			printf("打开目标文件失败!\n");
			break;
		case -3:
			printf("拷贝文件文件失败!\n");
			break;
		default:
			printf("出现未知情况!");
			break;
		}
	}
	system("pause");
}

意外发现:

在stdio.h文件中有 #define BUFSIZ  512 这么一个宏定义,
而我自定义的宏名称是BUFSIZE,所以,当我写成BUFSIZ 的时候,
编译器没有报错.
  • 2020-02-25
  • 16
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: 这个错误提示表示一个字节的 utf-8 序列的第一个字节不符合 utf-8 编码规则,无法被正确解析。可能是因为该字节不是 utf-8 编码中的有效字符,或者该字节不符合 utf-8 编码的规范。需要检查数据源是否正确,或者尝试使用其他编码方式进行解析。 ### 回答2: UTF-8是一种编码格式,用来存储Unicode字符集中的字符。UTF-8的编码方式是变长的,表示一个字符可能需要不同数量的字节。UTF-8中的每个字符都由一个或多个字节组成,其中第一个字节表示该字符所需的字节数。 在UTF-8编码中,字节1的前几个位用来表示该字符所需的字节数,如果字节1无效,表示该字符字节数无法被识别。 这种情况可能发生在以下情况下: 1. 字节1被损坏或丢失,导致无法判断该字符所需的字节数。 2. 字节1的值不在UTF-8编码范围内,例如超过了0xF4,因为UTF-8的编码范围只在U+0000至U+10FFFF之间。 3. 字节1的值不符合UTF-8的编码规则,导致解析器无法正确解码该字符。 因此,当出现字节1无效的情况时,需要检查UTF-8编码的相关规则,查看UTF-8字符序列是否符合规范。如果不符合规范,需要修复或重新编码该序列,以便正确解析该字符。同时,需要确保输入的数据流是正确的,并且没有被损坏或丢失。 ### 回答3: UTF-8 是一种在计算机中使用的字符编码方案,它使用 1 至 4 个字节来表示所有的 Unicode 字符。UTF-8 的编码规则是,对于 ASCII 字符(U+0000 至 U+007F),使用单字节编码,而对于 Unicode 码点超出 ASCII 范围的字符,则使用多字节编码。每个多字节字符的第一个字节的最高位都为1,其余各字节的最高位均为0,以此来区分单字节和多字节字符。 由于 UTF-8 是一种可变长度的编码格式,因此在解码过程中,需要严格按照编码规则进行解码。如果在一个 UTF-8 序列中,字节 1 不符合编码规则,那么这个序列就无法被正确解码。可能会导致解码器无法识别这个序列,或者解码出错误的字符码点,从而影响后续的应用程序处理。 要解决这个问题,需要对 UTF-8 序列进行严格的校验,确保其符合规定的编码规则。在处理 UTF-8 编码的数据时,需要注意保持编码和解码过程的一致性,以避免出现无效字节序列。同时,还需要注意编码字符时所选择的字符集,以保证字符可以正确地被编码和解码。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值