string类可以看做是对c语言字符串的一种封装,让我们可以将字符串看做一种新的数据结构,而不是字符数组。
一、构造字符串
下表中我们将使用缩写NBTS表示传统的C字符串。
构造函数 | 描述 |
---|---|
string(const char *s) | 将string对象初始化为s指向的NBTS |
string(size_type n,char c) | 创建一个长度为n的string对象,每个字符都被初始化为c |
string(const string & str) | 复制构造函数 |
string() | 无参构造,长度为0,默认构造函数 |
string(const char *s,sizetype n) | 将string对象初始化为s指向NBTS的前n个字符,即使超过了字符串结尾。 |
template <class Iter>string(Iter begin,Iter end) | 将string对象初始化为区间[begin,end)内的字符,其中begin和end行为就像指针,用于指定范围,前闭后开 |
string(const string &str,string size_type pos = 0,size_type n = npos) | 将一个string对象初始化为对象str中位置pos开始到结尾的字符,或者从位置pos开始的n个字符 |
string(string && str) noexcept | 这个是C++11新增的,它将一个string对象初始化为string对象str,并可能修改str |
string(initializer_list<char>il) | 这个是C++11新增的,它将一个string对象初始化为初始化列表il中的字符。 |
int main(){
using std::string;
char temp[] = "this is a string";
string s1("this is s1");
string s2(100, 'a');
string s3(s1);
string s4;
string s5(temp, 5);
string s6(&s1[1],&s1[5]);
string s7(s1,0,10);
cout << s1 << endl;
cout << s2 << endl;
cout << s3 << endl;
cout << s4 << endl;
cout << s5 << endl;
cout << s6 << endl;
cout << s7 << endl;
}
第六个构造函数有一个模板函数
template <class Iter> string(Iter begin,Iter end)
begin和end将像指针那样,指向内存中的两个位置(通常,begin和end可以是迭代器–广泛用于STL中的广义化指针)。构造函数将使用begin和end指向的位置之间的值,对string对象初始化。[begin,end)来自数学中的区间概念,前闭后开。
现在假设要用这个构造函数初始化一个对象,下面的语句不管用
string s6(s1+1,s1+5);
原因在于s1是一个对象,他不会被看做是地址,然而s1[1]返回的是一个char值,所以&s1[1]是一个地址,因此可以看做是构造函数的一个参数。
string s6(&s1[1],&s1[5]);
第八个构造函数类似于复制构造函数,导致新创建的string为str的副本,但与复制构造函数不同的是,它不保证将str视为const,这种构造函数成为移动构造函数,在一些情况下编译器可使用它而不是复制构造函数,以优化性能。
第九个构造函数string(initializer_list<char>il)能够让您将列表初始化语法用于string类,也就是说,他使得下面的声明是合法的。
string s1 = {'H','e','l','l','o'};
二、字符串的赋值,拼接,附加
在c中,不可以将一个字符数组直接赋值给另一个字符数组,需要赋值指针地址,或者用strcpy进行拷贝,strcat进行拼接,但是在c++中,你可以直接赋值,直接进行字符串的拼接
#include <iostream>
#include <string>
using namespace std;
int main() {
string s1 = "123";
string s2 = "456";
string s3 = s1 + s2;
s1 += s2;
cout << s3 << endl;
cout << s1 << endl;
}
三、字符串的长度
C语言中有一个函数来返回字符串的长度
strlen();
在c++的string类中,一个字符串是一个对象,我们需要调用字符串的方法
string s1 = "123";
s1.size();
s1.length();
为什么两个函数完成相同的任务呢?length()成员来自较早的string类,size()是为STL兼容性添加的。
四、其他形式的字符串
除了char类型之外,c++还有wchar_t类型,C++11还新增了char16_t,char32_t。对于这些类型的字符串字面值,C++分别使用前缀L,u,U来表示。当然我们也可以用u8来标注utf-8编码的字符串,但是C++默认的编码就是utf-8,所以没有很大的必要。
#include <iostream>
#include <string>
using namespace std;
int main() {
wchar_t a[] = L"123";
char16_t b[] = u"456";
char32_t c[] = U"789";
}
五、比较字符串
可以比较字符串。String类对全部6个关系运算符都进行了重载。如果在机器排列序列中,一个对象位于另一个对象的前面,则前者被视为小于后者。如果机器排列序列为ASCII码,则数字将小于大写字符,而大写字符小于小写字符。对于每个关系运算符,都以三种方式被重载,以便能够将string对象与另一个string对象、C风格字符串进行比较,并能够将C风格字符串与string对象进行比较:
string s1("qweqweqwsdasa");
string s2("asdzxcas");
char s3[100] = "asjhdakjshjghausghduiq";
if (s1 < s2) {...}
if (s2 < s3) {...}
六、find()方法
方法原型 | 描述 |
---|---|
size_type find(const string &str,size_type pos=0) const | 从字符串的pos位置开始,查找子字符串str,如果找到返回子字符串首次出现的首字符的索引,否则,返回string::npos |
size_type find(const char *s,size_type pos=0) const | 从字符串的pos位置开始,查找子字符串s,如果找到返回子字符串首次出现的首字符的索引,否则,返回string::npos |
size_type find(const char *s,size_type pos=0,size_type n) | 从字符串的pos位置开始,查找s的前n个字符组成的字符串如果找到返回该字符串出现时其首字符的索引,否则返回string::npos |
size_type find(char ch,size_type pos=0) const | 从字符串的pos位置开始,查找字符ch,如果找到返回该字符出现的位置,否则返回string::npos |
七、字符串种类
string库实际上是基于一个模板类的,模板basic_string有四个具体化,每个具体化都有一个typedef名称:
/// A string of @c char
typedef basic_string<char> string;
/// A string of @c wchar_t
typedef basic_string<wchar_t> wstring;
/// A string of @c char16_t
typedef basic_string<char16_t> u16string;
/// A string of @c char32_t
typedef basic_string<char32_t> u32string;
这让您能够使用基于类型 wchar_t、charl6_t、char32_t和char 的字符串。甚至可以开发某种类似字符的类,并对它使用 basic_string类模板(只要它满足某些要求)。traits 类描述关于选定字符类型的特定情况,如如何对值进行比较。对于wchar t、char16_t、char32_t和 char类型,有预定义的char_traits模板具体化,它们都是traits 的默认值。Allocator 是一个管理内存分配的类。对于各种字符类型,都有预定义的allocator模板具体化,它们都是默认的。它们使用new和 delete。