首先说一下string和char*的区别:
1.string是一个类,char*是一个指向字符串的指针
2.string封装了char*,是一个管理char*的一个容器
3.string不用考虑内存释放和越界,string管理char*所分配的内存,每一次string的复制,取值都由string类负责维护,
不用担心复制越界和取值越界等。
string的默认构造函数:
string();//构造一个空的字符串string s1;
拷贝构造函数:string(const string &str);
string s1(s2);
带参数的构造函数:string(const char *s);//用字符串初始化
string(int n,char c);//用n个字符c初始化
string的存取字符操作:
const char &operator[](int n)const;
const char &at(int n)const;
char &operator[](int n);
char &at(int n);
事例:
char c=strA[3];
char d=strS.at(5);
strA[3]='X';
strA.at(5)='Y';
operator[]和at()均返回当前字符串中第n个字符,但二者是有区别的。主要区别是在于at()在越界时会抛出异常,[]在刚好越界时会返回(char)0,
再继续越界,编译器直接出错.如果希望通过try,catch捕获异常,建议采取at().
把string拷贝到char *指向的内存空间的操作:
int copy(char *s,int n,int pos=0)const;
把当前串中以pos开始的n个字符拷贝到以s为起始位置的字符数组中,返回实际拷贝的数目。注意要保证s所指向的空间足够大以容纳当前字符
串,不然会越界.
string的长度:
int length()const;//返回当前字符串的长度。长度不包括字符串结尾的'\0'
bool empty()const;//当前字符串是否为空
string的赋值:
string &operator=(const string &s);// 把字符串s赋值给当前的字符串
string &assign(const char *s);//把字符串s赋值给当前的字符串
string &assign(const char *s,int n);//把字符串s的前n个字符赋给当前的字符串
string的连接:
string &operator+=(const string &s);//把字符串s连接到当前字符串结尾
string &operator+=(const char *s);//把字符串s连接到当前字符串的结尾
string &append(const char *s);//把字符串s连接到当前字符串结尾
string &append(const char *s,int n);// 把字符串s的前n个字符连接到当前字符串结尾
string &append(const string &s);//同operator+=()
string &append(const string &s,int pos,int n);//把字符串s中从pos开始的n个字符连接到当前字符串的结尾
string &append(int n,char c);//在当前字符串结尾添加n个字符
string的比较:
int compare(const string &s)const;//与字符串s比较
int compare(const char *s)const;//与字符串s比较
compare函数在>时返回1,<小于时返回-1,==于时返回0.比较区分大小写,比较时参考字典顺序.
string的子串:
string substr(int pos,int n=npos)const;//返回由pos开始的n个字符组成的子字符串
string的查找:
int find(char c,int pos=0)const;//从pos开始查找字符c在当前字符串的位置
int find(const char *s,,int pos=0)const;//从pos开始查找字符串s在当前字符串的位置
int find(const string &s,int pos=0)const;//从pos开始查找字符串s在当前字符串中的位置
int find(const string &s,int pos=0)const;//从pos开始查找字符串s在当前字符串中的位置
如果查找不到,就返回-1.
int rfind(char c,int pos=npos)const;//从pos开始从后向前查找字符c在当前字符串中的位置
int rfind(const char *s,int pos=npos)const;
int rfind(const string &s,int pos=npos)const;
//rfind是反向查找的意思,如果查找不到,返回-1
string的插入:
string &insert(int pos,const char *s);
string &insert(int pos,const string &s);
//前两个函数在pos位置插入字符串s
string &insert(int pos,int n,char c);//在pos位置,插入n个字符c
string的删除:
string &erase(int pos=0,int n=npos);//删除pos开始的n个字符,返回修改后的字符串
string的替换:
string &replace(int pos,int n,const char *s);//删除从pos开始的n哥字符,然后再pos处插入串s
string &replace(int pos,int n,const string 7s);//删除从pos开始的n个字符,然后再pos处插入串s
void swap(string &s2);//交换当前字符串与s2的值
string与wstring的区别:
string是对char*的管理,一个字符只占一个字节大小。一个汉字占两个字节ASCII编码
wstring是对wchar_t *的管理,一个字符占两个字节大小,一个函数占两个字节Unicode编码
wstring的使用方法跟string类似,区别主要在于参数char *和wchar_t *
string和wstring的转换:
第一种方法
调用Windows的API函数:WideCharToMultiByte()函数和MultiByteToWideChar()函数。
第二种方法
使用ATL的CA2W类与CW2A类。或使用A2W宏与W2A宏。
第三种方法,跨平台的方法,使用CRT库的mbstowcs()函数和wcstombs()函数,需设定locale。
以下是第三种方法的实现例子。
#include <string>
#include <locale.h>
using namespace std;
/wstring转成string
string ws2s(const wstring &ws)
{
string curLocale = setlocale(LC_ALL,NULL); //curLocale="C";
setlocale(LC_ALL,"chs");
const wchar_t * _Source=ws.c_str();
size_t _Dsize=2*ws.size()+1;
char * _Dest = new char[_Dsize];
memset(_Dest,0,_Dsize);
wcstombs(_Dest,_Source,_Dsize);
string result = _Dest;
delete[] _Dest;
setlocale(LC_ALL,curLocale.c_str());
return result;
}
//string转成wstring
wstring s2ws(const string &s)
{
string curLocale = setlocale(LC_ALL,NULL); //curLocale = "C"
setlocale(LC_ALL, "chs");
const char *_Source = s.c_str();
size_t _Dsize = s.size()+1;
wchar_t *_Dest = new wchar_t[_Dsize];
wmemset(_Dest,0,_Dsize);
mbstowcs(_Dest,_Source,_Dsize);
wstring result = _Dest;
delete[] _Dest;
setlocale(LC_ALL, curLocale.c_str());
return result;
}
如果我们想建立两个版本的程序,一个处理ASCII字符串,另一个处理Unicode字符串,
最好的解决办法是编写出既能按ASCII编译又能按Unicode编译的单一源代码。把以下代码
加入到程序中,只要修改一个宏就能满足我们的要求。
#ifdef _UNICODE
typedef wstring tstring;
typedef wchar_t tchar;
#define _T(x) L ## x
#else
typedef string tstring;
typedef char tchar;
#define _T(x) x
#endif