c语言对utf8字符串的截取

utf8编码的汉字一般占用3字节,下面默认汉字全是常规的3字节汉字。

void splitUtf8(const char *s, char* store, int l)
{                                                     
    if (strlen(s) <= 0 || l <=0)
    {
        return;
    }

    int i = 0, len = 0;
    int f_len = strlen(s) >= l ? l : strlen(s);
    while (i < f_len)
    {
        if (s[i] >> 7 & 1 && s[i+1] >> 7 & 1)
        {
            cout << "汉字 i = " << i << '\t';
            i = i + 3;
            len = 3;
        }
        else
        {
            cout << s[i] << "-i=" << i << '\t';
            i = i + 1;
            len = 1;
        }
        cout << "end-i=" << i << '\t';
    }
    //i += 1;
    cout << "\ni = " << i << ",len = " << len << endl;
    if (i > f_len)
        i = i - len;
    strncpy(store, s, i);
    *(store + i) = 0;
    cout << "desc len=" << strlen(store) << endl;
}

int main()
{
    string str = "一二三";
    //string str = "一二三四五六sss";
    char desc[64];
    memset(desc, 0, sizeof(desc));
    splitUtf8(str.c_str(), desc, 12);
    printf("desc =%s]\n", desc);
    strcat(desc, "123");
    printf("desc =%s]\n", desc);
}

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值