如何将中文输出为UTF-8字符

原创 2011年01月12日 15:50:00

int AToUtf8(LPCSTR pASCIIBuf,LPSTR pUtf8Buf)
{
 unsigned short* pWch;
 char szTmp[500];
 char szUTF8[20];
 int  ret;
    if (NULL==pASCIIBuf)
        return 0;
 pUtf8Buf[0] = '/0';
    //    ZeroMemory( wch, sizeof(WCHAR)*RECV_BUF );
    DWORD  UniCodeLen=MultiByteToWideChar(CP_ACP, 0, pASCIIBuf, -1, 0, 0);
    pWch = new unsigned short[UniCodeLen];
    MultiByteToWideChar(CP_ACP, 0, pASCIIBuf, -1, pWch, UniCodeLen);
    DWORD dwUtf8Len=WideCharToMultiByte(CP_UTF8, 0, pWch, UniCodeLen , NULL, NULL, NULL, NULL );
    if (NULL==pUtf8Buf)
 {
  delete[] pWch;
        return dwUtf8Len;
 }
    ret = WideCharToMultiByte(CP_UTF8, 0, pWch, UniCodeLen , (char*)szTmp, dwUtf8Len, NULL, NULL );
 delete[] pWch;
 for(int i=0;i<strlen(szTmp);i++)
 {
  sprintf(szUTF8,_T("%X"),(BYTE)szTmp[i]);
  strcat(pUtf8Buf,_T("%"));
  strcat(pUtf8Buf,szUTF8);
 }
 return ret;
}

版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

UTF-8中文字符表

  • 2015-03-25 21:00
  • 327KB
  • 下载

VS2015支持UTF-8 with BOM编码格式处理中文、西班牙文、法文等非英文字符

VS2015支持UTF-8 with BOM编码格式处理中文、西班牙文、法文等非英文字符 Detail: 在使用VS2015编译ImageMagicK库时,由于其中源码文件带有非英文字符串,导致VS编...

UTF-8和中文字符编码(GB2312、GBK、GIB5、GB18030)的识别

1、编码方式介绍 了解一种字符集编码主要是要了解该编码的编码范围,编码对应的字符集(都包含哪些字符),和其他字符集编码之间的关系等。 ASCII ASCII码是7位编码,编码范围是0...

python替换UTF-8编码文本中任意特殊字符,包括中文符号

问题: 大量文本,将其中的特殊字符用空格替换,特殊字符如:◆★,日期[1990-11-23]等。 这些文本有如下特点: 1.文件名以中文命名 2.经测试,文件编码为UTF-8 先看程序: ...

Python对中文字符的处理(utf-8/ gbk/ unicode)

现在在做分词的时候会处理大量有关中文字符的处理,经常输出乱码,老大让我暂时不考虑字符编码,但是为了看着爽不得不研究一下。 分词系统:NLPIR 因为不同的编译环境默认的汉字编码可能不一样,我的...

中文字符编码:GB2312、GBK、ANSI、Unicode、UTF-8

字符编码windows notepad、windows notepad++和sublime text的字符编码显示区别: windows notepad notepad++ sublime...

在Windows下使用TinyXML-2读取UTF-8编码包含中文字符的XML文件

本文介绍了在Windows下使用TinyXML-2读取UTF-8编码、包含中文字符XML文件的方法。

解决string.len 处理 utf-8 中文字符不正确的问题

解决string.len 处理 utf-8 中文字符不正确的问题。因为这个返回的结果是字节数(不是字符数),比如 UTF-8 里一个中文得到 3,在 GBK 里一个中文得到2。 据说是有个 stri...

php开发之截取中文字符,包括utf-8

程序一:PHP截取中文字符串方法 今天找到一个比较好的截取中文字符串方法,在此与大家共享。 function msubstr($str, $start, $len) { $tmpstr ...

asp 页面中gb2312页面接受utf-8编码字符的变量,字符编码转化时出错,中文字数是偶数的话就不会少,奇数的话就会少

路过的兄弟姐妹,大哥大姐,热心的高手们请帮小弟一个忙,不胜感激。我用以下的一个函数 来解决gb2312页面接受utf-8编码字符的变量编码出错问题,结果是中文字数是偶数的话就不会少,奇数的话就会少一个...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)