使用stdio.h和stdlib.h实现UTF-8转UTF-16的示例代码。代码中包含了对输入合法性的检测,并在出现错误时输出错误信息

此代码示例展示了如何使用stdio.h和stdlib.h库将UTF-8编码的字符串‘汉字测试’转换为UTF-16编码。程序会检查输入的合法性,若遇到非法UTF-8编码或内存分配问题,会显示错误信息。
摘要由CSDN通过智能技术生成
#include <stdio.h>
#include <stdlib.h>

// 检测一个字节是否是UTF-8的起始字节
int is_utf8_start_byte(unsigned char byte) {
    return ((byte & 0xC0) != 0x80);
}

// 计算一个UTF-8字符所占用的字节数
int utf8_byte_count(unsigned char byte) {
    if ((byte & 0x80) == 0) {
        return 1;
    }
    else if ((byte & 0xE0) == 0xC0) {
        return 2;
    }
    else if ((byte & 0xF0) == 0xE0) {
        return 3;
    }
    else if ((byte & 0xF8) == 0xF0) {
        return 4;
    }
    return -1; // 非法UTF-8字节
}

// UTF-8转UTF-16
void utf8_to_utf16(const unsigned char* utf8, unsigned short** utf16, int* utf16_len) {
    // 计算UTF-16字符串长度
    int len = 0; // UTF-16字符个数
    const unsigned char* p = utf8;
    while (*p != '\0') {
        if (is_utf8_start_byte(*p)) {
            int byte_count = utf8_byte_count(*p);
            if (byte_count < 0) {
                printf("错误:非法UTF-8编码\n"
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值