关于介绍Unicode字符串转换成ASCII码字符串的方法的网页很多了,下面是一个完成转化的函数:
char * UnicodeToASCII(UCHAR * buf)
{
wchar_t* pwszUnicode = (wchar_t *) buf;
int iSize;
char* pszMultiByte;
iSize = WideCharToMultiByte(CP_ACP, 0, pwszUnicode, -1, NULL, 0, NULL, NULL);
pszMultiByte = (char*)malloc((iSize+1)/**sizeof(char)*/);
WideCharToMultiByte(CP_ACP, 0, pwszUnicode, -1, pszMultiByte, iSize, NULL, NULL);
return(pszMultiByte);
}
我在读取NTFS格式文件系统中记录的文件名数据时,转化出来总是这样的效果:
Unicode代码 ---- > “testfile.txt??”
后面总是多两个问号,有的文件名转化出来多的怪字符则更多。分析以后发现出现这个问题的原因是调用UnicodeToASCII函数时的参数buf中的问题。
buf用来保存读取到的Unicode串,由于读到的Unicode串只有“testfile.txt”对应的代码数据,并没有Unicode串结束的标志。因此Unicode串转换时总是多转化了数据。可以这样做来解决上面的问题:
1) 申请buf空间时大小为Unicode串Size + 2;
2) buf[size] = '\0';
buf[size + 1] = '\0';
我实验了一下,只赋值一个“\0”似乎不行。
不当处请指正!