ANSI和UNICODE字符串处理常用函数

转自: https://blog.csdn.net/mjk1133/article/details/6676284

 

ANSI和UNICODE字符串处理常用函数

2018年05月30日 11:22:29 byxdaz 阅读数:530

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/byxdaz/article/details/80507510

ANSI和UNICODE字符串处理函数

在windows中ANSI和UNICODE字符串操作分别提供了相应的函数,也提供了一套兼容两者的函数。比如:
#ifdef  UNICODE   
    #define _tcscpy     wcscpy  
#else  
    #define _tcscpy     strcpy  
#endif

字符串处理函数常用函数对照

ANSIUNICODE通用说明
数据类型
(char.h)(wchar.h)(tchar.h) 
charwchar_tTCHAR 
char *wchar_t *TCHAR* 
LPSTRLPWSTRLPTSTR 
LPCSTRLPCWSTRLPCTSTR 
    
字符串转换
atoi_wtoi_ttoi把字符串转换成整数(int)
atol_wtol_ttol把字符串转换成长整型数(long)
atof_wtof_tstof把字符串转换成浮点数(double)
itoa_itow_itot将任意类型的数字转换为字符串
    
字符串操作
strlenwcslen_tcslen获得字符串的数目
strcpywcscpy_tcscpy拷贝字符串
strncpywcsncpy_tcsncpy类似于strcpy/wcscpy,同时指定拷贝的数目
strcmpwcscmp_tcscmp比较两个字符串
strncmpwcsncmp_tcsncmp类似于strcmp/wcscmp,同时指定比较字符字符串的数目
strcatwcscat_tcscat把一个字符串接到另一个字符串的尾部
strncatwcsncat_tcsnccat类似于strcat/wcscat,而且指定粘接字符串的粘接长度.
strchrwcschr_tcschr查找子字符串的第一个位置
strrchrwcsrchr_tcsrchr从尾部开始查找子字符串出现的第一个位置
strpbrkwcspbrk_tcspbrk从一字符字符串中查找另一字符串中任何一个字符第一次出现的位置
strstrwcsstr/wcswcs_tcsstr在一字符串中查找另一字符串第一次出现的位置
strcspnwcscspn_tcscspn返回不包含第二个字符串的的初始数目
strspnwcsspn_tcsspn返回包含第二个字符串的初始数目
strtokwcstok_tcstok根据标示符把字符串分解成一系列字符串
 wcswidth 获得宽字符串的宽度
 wcwidth 获得宽字符的宽度
    
字符串测试
isasciiiswascii_istascii测试字符是否为ASCII 码字符, 也就是判断c 的范围是否在0 到127 之间
isalnumiswalnum_istalnum测试字符是否为数字或字母
isalphaiswalpha_istalpha测试字符是否是字母
iscntrliswcntrl_istcntrl测试字符是否是控制符
isdigitiswdigit_istdigit测试字符是否为数字
isgraphiswgraph_istgraph测试字符是否是可见字符
isloweriswlower_istlower测试字符是否是小写字符
isprintiswprint_istprint测试字符是否是可打印字符
ispunctiswpunct_istpunct测试字符是否是标点符号
isspaceiswspace_istspace测试字符是否是空白符号
isupperiswupper_istupper测试字符是否是大写字符
isxdigitiswxdigit_istxdigit测试字符是否是十六进制的数字
大小写转换
tolowertowlower_totlower把字符转换为小写
touppertowupper_totupper把字符转换为大写
字符比较
strcollwcscoll_tcscoll比较字符串
日期和时间转换
strftimewcsftime_tcsftime根据指定的字符串格式和locale设置格式化日期和时间
strptime  根据指定格式把字符串转换为时间值, 是strftime的反过程
打印和扫描字符串
printfwprintf_tprintf使用vararg参量的格式化输出到标准输出
fprintffwprintf_ftprintf使用vararg参量的格式化输出
scanfwscanf_tscanf从标准输入的格式化读入
fscanffwscanf_ftscanf格式化读入
sprintfswprintf_stprintf根据vararg参量表格式化成字符串
sscanfswscanf_stscanf以字符串作格式化读入
vfprintfvfwprintf_vftprintf使用stdarg参量表格式化输出到文件
vprintf  使用stdarg参量表格式化输出到标准输出
vsprintfvswprintf_vstprintf格式化stdarg参量表并写到字符串
sprintf_sswprintf_s_stprintf_s格式化字符串
数字转换
strtodwcstod_tcstod把字符串的初始部分转换为双精度浮点数
strtolwcstol_tcstol把字符串的初始部分转换为长整数
strtoulwcstoul_tcstoul把字符串的初始部分转换为无符号长整数
_strtoi64_wcstoi64_tcstoi64 
    
输入和输出
fgetcfgetwc_fgettc从流中读入一个字符并转换为宽字符
fgetsfgetws_fgetts从流中读入一个字符串并转换为宽字符串
fputcfputwc_fputtc把宽字符转换为多字节字符并且输出到标准输出
fputsfputws_fputts把宽字符串转换为多字节字符并且输出到标准输出串
getcgetwc_gettc从标准输入中读取字符, 并且转换为宽字符
getchargetwchar_gettchar从标准输入中读取字符
putcputwc_puttc标准输出
putcharputwchar_puttchar标准输出
ungetcungetwc_ungettc把一个字符放回到输入流中

 

多字节和宽字节字符串的转换
使用MultiByteToWideChar函数和WideCharToMultiByte函数可以实现多字节宽字节之间的转换。ATL的一个很好的字符串的转换宏:A2W和W2A,使用起来更加简单。
一、MultiByteToWideChar和WideCharToMultiByte函数

 
  1. #include <string>

  2. #include <windows.h>

  3. using namespace std;

  4. //Converting a WChar string to a Ansi string

  5. std::string WChar2Ansi(LPCWSTR pwszSrc)

  6. {

  7. int nLen = WideCharToMultiByte(CP_ACP, 0, pwszSrc, -1, NULL, 0, NULL, NULL);

  8. if (nLen<= 0) return std::string("");

  9. char* pszDst = new char[nLen];

  10. if (NULL == pszDst) return std::string("");

  11. WideCharToMultiByte(CP_ACP, 0, pwszSrc, -1, pszDst, nLen, NULL, NULL);

  12. pszDst[nLen -1] = 0;

  13. std::string strTemp(pszDst);

  14. delete [] pszDst;

  15. return strTemp;

  16. }

  17. string ws2s(wstring& inputws)

  18. {

  19. return WChar2Ansi(inputws.c_str());

  20. }

  21. //Converting a Ansi string to WChar string

  22. std::wstring Ansi2WChar(LPCSTR pszSrc, int nLen)

  23. {

  24. int nSize = MultiByteToWideChar(CP_ACP, 0, (LPCSTR)pszSrc, nLen, 0, 0);

  25. if(nSize <= 0) return NULL;

  26. WCHAR *pwszDst = new WCHAR[nSize+1];

  27. if( NULL == pwszDst) return NULL;

  28. MultiByteToWideChar(CP_ACP, 0,(LPCSTR)pszSrc, nLen, pwszDst, nSize);

  29. pwszDst[nSize] = 0;

  30. if( pwszDst[0] == 0xFEFF) // skip Oxfeff

  31. for(int i = 0; i < nSize; i ++)

  32. pwszDst[i] = pwszDst[i+1];

  33. wstring wcharString(pwszDst);

  34. delete pwszDst;

  35. return wcharString;

  36. }

  37. std::wstring s2ws(const string& s)

  38. {

  39. return Ansi2WChar(s.c_str(),s.size());

  40. }

 

二、A2W、W2A、A2T、T2A的使用方法
类型T。如果定义了 _UNICODE,则T表示W;如果定义了 _MBCS,则T表示A
头文件包含
#include <atlbase.h>


(1)A2W的用法:

 
  1. USES_CONVERSION; // 只需要调用一次,就可以在函数中进行多次转换

  2. CString tmpStr;

  3. char*LineChar="fdsfdsa";

  4. const WCHAR * cLineChar = A2W(LineChar);

  5. tmpStr=cLineChar;

  6. //获取字符个数

  7. wcslen(cLineChar );

(2)W2A的用法:

 
  1. USES_CONVERSION;

  2. CString tmpStr;

  3. WCH LineChar="fdsfdsa";

  4. const char* cLineChar = A2W(LineChar);

(3)A2T的用法:

 
  1. USES_CONVERSION;

  2. char * pChar="char to cstring";

  3. CString cTemp=A2T(pChar);

(4)T2A的用法:

 
  1. USES_CONVERSION;

  2. CString cTemp =_T("char to cstring");

  3. char * pChar=T2A(cTemp.GetBuffer(cTemp.GetLength()));

 


 

三、几种ANSI和UNICODE的宏定义
L 在字符串前加一个L,如 L”我的字符串” 表示将ANSI字符串转换成unicode的字符串,就是每个字符占用两个字节。 
strlen(L”asd”) = 6; 
_T宏可以把一个引号引起来的字符串,根据你的环境设置,使得编译器会根据编译目标环境选择合适的(Unicode还是ANSI)字符处理方式。
TEXT,_TEXT 和_T 一样的。

std兼容字符串定义

 
  1. #ifdef _UNICODE

  2. #define tstring std::wstring

  3. #else

  4. #define tstring std::string

  5. #endif

long int strtol(const char *str, char **endptr, int base) 把参数 str 所指向的字符串根据给定的 base 转换为一个长整数(类型为 long int 型),base 必须介于 2 和 36(包含)之间,或者是特殊值 0。

实例:

 
  1. #include <stdio.h>

  2. #include <stdlib.h>

  3. int main()

  4. {

  5. char str[30] = "2030300 This is test";

  6. char *ptr;

  7. long ret;

  8. ret = strtol(str, &ptr, 10);

  9. printf("数字(无符号长整数)是 %ld\n", ret);

  10. printf("字符串部分是 |%s|", ptr);

  11. return(0);

  12. }

结果:

数字(无符号长整数)是 2030300
字符串部分是 | This is test|

开源字符转换iconv
http://www.gnu.org/software/libiconv/
https://blog.csdn.net/langresser_king/article/details/7459367

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值