string 转化成 unicode 支持中文,中英文混合转转化

思路:

uft8下的中文是 3个字节,分别是 1110 xxxx 10xx xxxx 10xx xxxx,所以遇到中文的是3个字节读入,以0x80为判断条件。英文字符都是一个字节录入。

函数:

输入:

str:字符串

str_len:转化后的的长度

chnum:中文个数

ennum:英文个数

 

 

static int* StringToUnicode(string str,int* str_len,int * chnum,int * ennum)
{
    int* result;
    int* res;
    int en_num = 0;
    int ch_num = 0;
    int num = 0;
    int max_len = 512;
    
    res = (int*)malloc(sizeof(int)*max_len);
    memset(res,0,sizeof(int)*max_len);
    
    long int r = 0x0000;
    int count = 0;    
    int ch_index = 0;
    for(int i = 0;i<str.size();i++)
    {
        int    s = (int)str.at(i);
        //printf("%4x ",(int)str.at(i));
        if(s>=0x80)
        {
            if(ch_index == 0)
            {
                r = 0x0000;
                r += (s-0xe0)<<12;
                ch_index ++;
            }
            else if(ch_index == 1)
            {
                r += (s-0x80)<<6;
                ch_index ++;
            }
            else if(ch_index == 2)
            {
                r += (s-0x80);
                ch_index = 0;;
                ch_num ++ ;
        //        printf("r = %x \t",r);
                res[count%max_len] = r;
                count ++;
            }
        }
        else
        {
            r = 0x0000;
            ch_index = 0;
            en_num ++ ;
            res[count%max_len] = s;
        //    printf("r = %x \t",s);
            count ++;
        }
    }
    //printf("\n");
    num = ch_num + en_num;
    *str_len = num;
    *chnum = ch_num; 
    *ennum = en_num;
    
    //printf("string len %d chinese num:%d en_num:%d \n",str.size(),ch_num,en_num);
    result = (int*)malloc(sizeof(int)*num);
    memset(result,0,sizeof(int)*num);

    for(int i = 0;i <num;i++)
            result[i] = res[i];
    
    free(res);
    res = NULL;
    
    return result;    
}

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值