wstring,WCHAR,TCHAR,CHAR

   写在这里备忘。自己在写一个通过文件名查找文件夹(包含子文件夹)下的文件,并找到相应文件的绝对路径并写入txt文件的程序时看到的一些资料以及感悟。

1.将wstring输入到txt文件的操作

<span style="font-size:12px;">#include "stdafx.h"

#include <string>
#include <fstream>
using namespace std;

int _tmain(int argc, TCHAR* argv[], TCHAR* envp[])
{
	wstring result = L"Hell你好,世界!!!World!";
	wofstream f;
	locale oldLocale1 = f.imbue(locale(std::locale("chs"),"",LC_CTYPE));//为了对中文操作

	f.open(L"F:\\11.txt", wios::app);
	f <<result.c_str()<<endl;
	f.close();

	f.imbue(oldLocale1);<span style="font-family: Arial, Helvetica, sans-serif;">//为了对中文操作</span>
	return 0;
}
</span>
<span style="font-size:12px;">
</span>
<span style="font-size:12px;">
</span>


2.对const char * 类型转换到TCHAR*,用函数_T();或者_TEXT();但记得加上头文件tchar.h

     如将"*.*"的转换即用_T("*.*");



3.对于LPCTSTR(const TCHAR*)可先转换为wstring类型 ,然后push 进vector

   比如 vector<LPCSTR> vecPath;

            LPCSTR szPath="......";

            vecPath.push_back(szPath);//大量数据时将会出错,push进的数据一部分为乱码,不知道为什么?

 解决办法:

       wstring str=szPath;

       vector<wstring>vecPath;

       之后再试没有出现数据的改变;



4.WCHAR,TCHAR,CHAR区别

   转自:http://blog.csdn.net/scollins/article/details/5657957

   C++的字符分成两种类型wchar_t和char。   
   其中   WCHAR==wchar_t,CHAR==char。   
   TCHAR是一种条件编译的类型,根据条件可以代表wchar_t或char。

  #ifdef   UNICODE     
          typedef   wchar_t   TCHAR;     
  #else     
          typedef   unsigned   char   TCHAR;     
  #endif   

  typedef   unsigned   char   CHAR;     
  typedef   unsigned   wchar_t   WCHAR;

   CHAR为单字节字符。还有个WCHAR为Unicode字符,即不论中英文,每个字有两个字节组成。如果当前编译方式为ANSI(默认)方式,TCHAR等价于CHAR,如果为Unicode方式,TCHAR等价于WCHAR。在当前版本LPCSTR和LPSTR没区别,即以零结尾的字符串指针,相当于CHAR *。 LPSTR、LPCSTR相当于char *,所以这种类型变量的赋值等同于char *的赋值。

  Ex1: LPSTR lpstrMsg = "I'm tired."; 
  Ex2: char strMsg[]="I'm tired."; 
  LPSTR lpstrMsg = (LPSTR) strMsg;

  unsigned short * 和 char* : 一个是宽字符,一个是多字节,两种编码是不一样的。

  如果你的程序要想在全球发布,一定要使用宽字符Unicode,

  TChar strFileName[MAX_PATH] = TEXT("");
  char strFileName[MAX_PATH]="";

  TEXT就是L
 有点象这样:
 #define TEXT(str)   L##str
 ##是连接的意思就是将L和str联在一起了,表示宽字符。
 L"Hello World",和"Hello World"是不同的,前一个占用24个char,后一个占用了12个char
 如果定义了
  #define UNICODE
 TCHAR就代表宽字符wchar(2*sizeof(char)),否则TCHAR就代表char

  也就是说在有
 #define UNICODE 
  的情况下

 TChar strFileName[MAX_PATH] = TEXT(""); //代表定义了一个空的宽字符串
 char strFileName[MAX_PATH]="";//代表定义了一个ASCII字符串

 如果没有定义#define UNICODE那么
 TChar strFileName[MAX_PATH] = TEXT(""); //编译器似乎会报错,没尝试过
 char strFileName[MAX_PATH]="";//代表定义了一个ASCII字符串

int len=0; 
char *temp; 
strcpy(temp,"hello"); 
len=strlen(temp); 
char *unicodechar; //不一定是char*型,应该是什么型 
int unicodelen; 
//如何把temp=>unicodechar,并且长度为unicodechar的byte长度 
比如 
temp="a" len=1 
unicodechar=0x000x61 unicodelen=2;

将ANSI转换到Unicode 
(1)通过L这个宏来实现,例如: CLSIDFromProgID( L"MAPI.Folder",&clsid); 
(2)通过MultiByteToWideChar函数实现转换,例如: 
char *szProgID = "MAPI.Folder"; 
WCHAR szWideProgID[128]; 
CLSID clsid; 
long lLen = MultiByteToWideChar(CP_ACP,0,szProgID,strlen(szProgID),szWideProgID,sizeof(szWideProgID)); 
szWideProgID[lLen] = '/0'; 
(3)通过A2W宏来实现,例如: 
USES_CONVERSION; 
CLSIDFromProgID( A2W(szProgID),&clsid);

char to TCHAR , TCHAR to char

   在编写Wince程序时,遇到了一个问题如下:有的函数的返回值是char型的,如何将其转换成Tchar型,比如列举注册表函数RegEnumValue()返回的值中,有一个返回值是得到指定键的值。它是BYTE(unsigned char)型的,如何将其很容易的转成Tchar型,用了函数MultiByteToWideChar(),但是总是只转第一个字符,不知道哪里出了问题?
答:可以把BYTE的值赋给CString变量,再用wcscpy函数把CString变量的值赋给TCHAR数组。 
ANSI to Unicode:
--------------------------------------------------
char *pAnsiString = "Some test string";
CString strUnicode = pAnsiString;
---------------------------------------------------

如何把 char 转为lpctstr
mbstowcs---Convert a multi-byte(ANSI) string to wide character stirng(Unicode).
wcstombs---Convert a wide character string to multi-byte string.

--------------------------------------------------

cstring TCHAR的互相转换

cstring->TCHAR*的转化可以用函数GetBuff()

函数原型为:LPTSTR GetBuffer( int nMinBufLength );
cstring str("cstring");
TCHAR* szMsg = new TCHAR[100];
//其参数为cstring字符串的长度
szMsg = str.GetBuffer(str.GetLength());
str.ReleaseBuffer();
delete []szMsg;
szMsg = NULL;

TCHAR*->cstring的转化

TCHAR szTchar[18] = L"TCHAR";   
cstring str;   
str.Format(_T("%s"),szTchar); 
-------------------------------------------------------------
Unicode to ANSI:
char* GetAnsiString(const CString &s)
{
int nSize = s.GetLength();
char *pAnsiString = new char[nSize+1];
wcstombs(pAnsiString, s, nSize+1);
return pAnsiString;
}
CString strUnicode = _T("Some test string");
char *pAnsiString = GetAnsiString(strUnicode);



5.WCHAR 的相关操作

转自:http://www.cppblog.com/shongbee2/archive/2009/04/28/81349.html


http://hi.baidu.com/shongbee2/blog/item/207925546b6cdd5fd10906e0.html
http://hi.baidu.com/shongbee2/blog/item/d4a057511e9539878c5430cb.html
看了之后我才发现原来有wcsXXX的函数专门处理宽字节的,就是strXXX一样好使。呵呵,我不再惧怕了,就试着自己写了一下,还是学了蛮多东西的:
1.有wcsXXX的函数和strXXX的函数对应处理宽字节,wcslen就是求长度的,wcscmp就是比较两个字符串的。
2.输出也有相关的操作,wprintf(L”%s%s”);这样的操作,对文件也可以用fwprintf函数来输出。不过我发现貌似cout << wchar;不成功。也发现了一个问题,就是我输出”相等”这样一个字符串的时候,发现居然输出不正确,无论是控制台和文件都有错误。可见,这个还是有点小问题的。输出其他的例如”12345”等都是正常的。哎,这个函数并不可靠啊。
3.宽字节和普通串的转换问题,学了两个函数,一个是:
wcstombs(char* strDes, const wchar*, size_t nMax);这个函数的作用是把wchar转换为char。
char* strDes 为保存转换后的普通字符串,wchar* 要被转换的宽字符串。转换的最大长度。这里的长度是转换的个数,而不是字节长度。
mbstowcs() 就是一个相反的过程了,参数就不说了。

另一套转换的函数是:
int WideCharToMultiByte(
  UINT CodePage, 
  DWORD dwFlags, 
  LPCWSTR lpWideCharStr,
  int cchWideChar, 
  LPSTR lpMultiByteStr, 
  int cbMultiByte,
  LPCSTR lpDefaultChar,    
  LPBOOL lpUsedDefaultChar
);
他的参数很多,上面的连接有介绍,这里就不怎么细说了。
第一个是编码的方式,我一般用CP_ACP。第二个是转换标志,MSDN上说什么都不设置更快,然后我就什么都不管了就用NULL了。具体作用不知道,等遇到了再学。第三个参数就是被转换的字符串,第四个参数是该字符串的长度,-1表示自动算长度,如果是手动给出,一定要把最后的终结符长度也算上。我觉得还是-1来的实际。第五个参数就是保存转换串的指针,第六个参数就是保存串的长度,这里是单位字符的个数。如果转换的时候没有终结符,那么结果也没有终结符,要注意下。最后两个参数就是默认的填充字符和是否使用了默认填充字符,我一般就用NULL代替。

普通串转宽字节也是类似。
这里有几个注意的,一定要保证空间足够。还有就是那个长度是单位字符个数,而不是字节数,在转换时,推荐被转换的字符串长度设置为-1,因为这样他会自动算出终结符结束。返回值也是转换的单位字符个数。例如”相等”有普通串转换为宽字节串,返回结果是3,(有终结符),而反过来就是5。如果返回时0 说明转换失败。

心得:虽然WideCharToMultiByte的参数要多,感觉用的没有wcstombs爽,可是他的准确好高一些,要转换的话,还用用WideCharToMultiByte比较合适,还有就是虽然有一套wcsXXX的库函数,可惜输出还是出现问题的。如果全都用宽字节,那没有关系wcsxxx的函数还是蛮好用的。还有一个疑惑我明明查字典multi是多的意思也就是说multibyte是多字节,我的中文版VS2005配置里面也是说的多字节。搞不懂为什么要用宽字节呢?可能是多字节编码不好用吧。呵呵。 废话也说完了,奉上源代码:

#include <iostream>
#include <fstream>
#include <windows.h>
using  namespace std;

int main()
{
    FILE* fp ;
    WCHAR wchar[5] = L"相等相等";         // 定义一个宽字节的变量,初始为"相等"
    fp = fopen("1.txt", "w+");         // 打开文件称奥做
    fwprintf(fp, L"%s\n", wchar);     // 输出到文件
    fclose(fp);                         // 关闭文件
    WCHAR wc2[5];                     // 定义第二个宽字节变量
    
    
// wc开始的有很多宽字节的操作。都和str相对应。
    wcscpy(wc2, wchar);                 // 复制。
     int n = wcscmp(wc2, wchar);         // 比较
     if (n == 0)
    {
        wprintf(L"相等\n");             // 这里是否注意到没有wprintf有问题的。
    }

     char str[10];                     // 定义char字符。
    n = wcstombs(str, wc2, 9);         // 宽字节转换为muiltychar
    printf("%s\n", str);             // 输出结果

     for ( int i = 0; i < 5; ++i)
    {
        wc2[i] = L'1' + i;
    }
    wc2[4] = 0;

    n = wcstombs(str, wc2, 9);         // 宽字节转换为muiltychar
    printf("%s\n", str);             // 输出结果
    
// 另外的方式转换
    n = WideCharToMultiByte(CP_ACP, NULL, wchar, wcslen(wchar) + 1, str, 10, 0, 0);
    printf("%s\n", str);
     char str2[10] = "加一";
    WCHAR wc3[10];
    n = MultiByteToWideChar(CP_ACP, NULL, str2, strlen(str2) + 1, wc3, 10);     // char到宽字节。

    system("pause");
     return 0;
}




最后附代码,有点不伦不类,但实现功能。

#include<iostream>
#include<fstream>

#include <windows.h>
#include <tchar.h>
#include<string.h>
#include<vector>
#include<iterator>
#define represent "*.*"
using namespace std;

class FindFilePath
{
public:
	void FindFiles(LPCTSTR szPath, std::vector<wstring>& vecPath);
	vector<wstring> vecPath_absolute;
};


VOID FindFilePath::FindFiles(LPCTSTR szPath, std::vector<wstring>& vecPath)
{
	HANDLE hFind(NULL);
	WIN32_FIND_DATAW FindFileData;
	BOOL	bNext = TRUE;
	vector<WCHAR*> vecPath_absolute_period;


	TCHAR szFind[MAX_PATH]; 
	int i=0;
	lstrcpy(szFind, szPath);
	lstrcat(szFind,_T ("\\*.*")); // 找所有文件 
	tch

	
	hFind = FindFirstFileW(szFind, &FindFileData);
	if (hFind != INVALID_HANDLE_VALUE)
	{
		//cout<<"read success"<<endl;

		while (bNext)
		{
			if (wcscmp(FindFileData.cFileName, L".") == 0 || wcscmp(FindFileData.cFileName, L"..") == 0)//文件夹直接跳过
			{
				bNext = FindNextFileW(hFind, &FindFileData);
				continue;
			}
			if (FindFileData.dwFileAttributes & FILE_ATTRIBUTE_DIRECTORY)//是目录的话
			{
				WCHAR szFolder[MAX_PATH];
				if (szPath[wcslen(szPath) - 1] == '\\')//路径设置到下一级
					swprintf(szFolder, L"%s%s", szPath, FindFileData.cFileName);
				else
					swprintf(szFolder, L"%s\\%s", szPath, FindFileData.cFileName);
				FindFiles(szFolder, vecPath);//递归找下级文件

				bNext = FindNextFileW(hFind, &FindFileData);
				continue;
			}
			else
			{
			    wstring str = FindFileData.cFileName;
				vecPath.push_back(str);
				//vecPath_absolute.push_back(szPath);//why??
			    wstring str1=szPath;
				vecPath_absolute.push_back(str1);

			}
			bNext = FindNextFileW(hFind, &FindFileData);
		}
		FindClose(hFind);
	}


}



int main()
{
	//WCHAR szPath_src[MAX_PATH] = L"C:\\Users\\dhy\\Desktop\\baseball_with_impact";
	WCHAR szPath_src[MAX_PATH] = L"C:\\Users\\ocean\\Desktop";
	WCHAR szPath_dest[MAX_PATH]=L"D:\\Document";
	//WCHAR szPath_dest[MAX_PATH] = L"C:\\Data\\User_uploaded_videos\\20150330\\baseball\\*.*";
	std::vector<wstring> vecfilename_dest;
	std::vector<wstring> vecfilename_src;


	
	FindFilePath src,dest;
	src.FindFiles(szPath_src, vecfilename_src);
	dest.FindFiles(szPath_dest, vecfilename_dest);



	//wfstream out("C://Users//dhy//Desktop//baseball_with_impact//folder_list.txt",ios::out);
	wofstream out;
	out.open("folder_list.txt",wios::out);
	locale oldlocale=out.imbue(locale(locale("chs"),"",LC_CTYPE));//汉字可显
	if (!out.is_open())
	{
		cout<<"cannot find the txt"<<endl;
		return 0;
	}
		vector <wstring>::iterator it_src,it_dest;
		vector<wstring>::iterator it_path_dest ;
		for (it_src=vecfilename_src.begin();it_src!=vecfilename_src.end();it_src++)
		{
		for(it_dest=vecfilename_dest.begin(),it_path_dest=dest.vecPath_absolute.begin();it_dest!=vecfilename_dest.end();it_dest++,it_path_dest++)
		
			 {
				 if(wcscmp(it_dest->c_str(),it_src->c_str())==0)
				 {
				 cout<<"find "<<endl;
				 out<<it_path_dest->c_str();
				 out<<"\\";
				 out<<it_dest->c_str();
				 out<<endl;
				 continue;//找到之后跳出循环下一个,假定只有一个同样文件
				 }
			
			 }
		    
		}
		out.close();
		out.imbue(oldlocale);//可显示汉字
		return 0;
	}


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值