string 转化成 unicode 支持中文,中英文混合转转化

思路:

uft8下的中文是 3个字节,分别是 1110 xxxx 10xx xxxx 10xx xxxx,所以遇到中文的是3个字节读入,以0x80为判断条件。英文字符都是一个字节录入。

函数:

输入:

str:字符串

str_len:转化后的的长度

chnum:中文个数

ennum:英文个数

 

 

static int* StringToUnicode(string str,int* str_len,int * chnum,int * ennum)
{
    int* result;
    int* res;
    int en_num = 0;
    int ch_num = 0;
    int num = 0;
    int max_len = 512;
    
    res = (int*)malloc(sizeof(int)*max_len);
    memset(res,0,sizeof(int)*max_len);
    
    long int r = 0x0000;
    int count = 0;    
    int ch_index = 0;
    for(int i = 0;i<str.size();i++)
    {
        int    s = (int)str.at(i);
        //printf("%4x ",(int)str.at(i));
        if(s>=0x80)
        {

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值