写在前面: 学习标准库,学会看文档是很重要的技能。
链接: cplusplus网站
string介绍
在cplusplus这个网站上的介绍可以知道,string是C++标准库中的一个类,*而且可以发现string其实是一个宏,是typedef basic_string<char> string;
其中basic_string
是类名,宏替换为string
。可以发现也是一个类模板实例化为char类型的一个 类 类型。所以可以理解为string
就是一个存储字符串的一个类。之所以定义为宏和编码方式有关。
在 C语言 中,字符串是以\0结尾的一些字符的集合,C++面向对象编程,于是 C++ 中就引入了string类,它可以看做是一个管理字符串的数据结构。
string 就是字符串的意思,是 C++用来代替 char 数组 的数据结构。里面封装了一些常用的方法,方便我们地对其进行一些操作,而且string的空间大小是动态变化的,大大减小了不必要的花销
如果要使用这个类就要包含他的头文件< string >
string 类与 char * 的区别:
C++ 中,std::string 是用于处理字符串的标准库类。它提供了一系列成员函数和操作符,使得字符串的操作更加方便和灵活。
- char* 是一个指针
- string本质上是一个类,类的内部封装了char*,即string是一个char*型的容器
- string管理char * 所分配的内存,不用担心复制越界和取值越界等
总结:
string 是表示字符串的字符串类。
该类的接口与常规容器的接口基本相同,再添加了一些专门用来操作 string 的常规操作。
string 在底层实际是:basic_string 模板类的别名。
实现为:typedef basic_string<char, char_traits, allocator> string;
string函数简单介绍
简单介绍几个string的构造函数,其他的类似查文档即可
上图是string的几个构造函数,类的构造支持重载,所以构造函数也有很多个,第一个和第二个分别是默认构造和拷贝构造。无需多介绍,第三个可以看到有三个参数,还要一个给了缺省值。
看说明可以了解是通过一个字符串的一个位置,len个长度进行构造。如果长度超过字符串长度就一直到结尾。那缺省值是什么呢?
点进去可以发现是一个无符号整型,给的值是-1,既然无符号,还给-1,那就是整型的最大值了。意思就是,如果不给参数,就是默认无符号最大值,大概是4G的大小,字符串不可能那么大,于是不给值就默认取到结尾了。
void test1()
{
string s1;//第一个构造函数
string s2("Hello World");//第四个
string s3(s2);//第二个
string s4(s3,3,100);//第三个
string s5(s3, 6);//第三个
string s6("Hello World", 7);//第五个,用前n个构造
cout << s1 << endl;
cout << s2 << endl;
cout << s3 << endl;
cout << s4 << endl;
cout << s5 << endl;
cout << s6 << endl;
}
int main()
{
test1();
return 0;
}
我们发现可以直接cout输出string的对象,这是因为库里面已经重载了输出流。
string的遍历方式
接口名称 | 接口说明 |
---|---|
operator[ ] | 返回pos位置的字符,const string类对象调用 |
at ( ) | 返回pos位置的字符,const string类对象调用 |
迭代器 | begin() + end() 或者 rbegin() + rend() |
范围for | C++11支持更简洁的范围for的新遍历方式 |
operator[ ]
string类提供了大小和容量还要重载,如下
运算符重载如下,可以知道有两个重载,一个可读可写,一个只读。这样就可以像字符串一样访问并修改了。
void test2()
{
string s1("Hello World");
for (int i = 0; i < s1.size(); i++)
{
cout << s1[i] << " ";
}
cout << endl;
cout << s1.size() << endl;
cout << s1.capacity() << endl;
}
int main()
{
test2();
return 0;
}
我们知道,其实这个 string 类的对象会在堆区中开辟出一块数组空间来存放相对应的字符,最后为了和C语言保持一致会在最后面加上一个\0,那为何这里在打印的时候没有看到呢?
其实C++为了和C语言保持一致,也会在最后面加“ \0 ”,但是只是作为一个标识符,并不算在size里面。capacity也不包含“ \0 ”占用的空间,但是“ \0 ”是属于字符串的,实际大小要比显示的多1
迭代器
迭代器是C++提供的类似指针的用法的接口。前四个是最常用的
用法:
void test3()
{
string s1("Hello World");
string::iterator its3 = s1.begin();
while (its3 != s1.end())
{
cout << *its3 << " ";//解引用访问
++(*its3);//解引用改变某个位的值
++its3;//++到下一个位置
}
its3 = s1.begin();
cout << endl;
while (its3 != s1.end())//s1.end()是“/0”的个位置
{
cout << *its3 << " ";
++its3;
}
cout << endl;
}
int main()
{
test3();
return 0;
}
其中string::iterator its3 = s1.begin();
its3就是一个迭代器
函数名称 | 使用说明 |
---|---|
begin() | 返回指向第一个元素的迭代器 |
end() | 返回指向最后一个元素的下一个位置的迭代器 |
rbegin() | 返回指向最后一个元素的反向迭代器 |
rend() | 返回指向第一个元素的前一个位置的反向迭代器 |
不仅有正向迭代器,还有反向迭代器
void test5()
{
string s1("Hello World");
string::reverse_iterator rits3 = s1.rbegin();
while (rits3 != s1.rend())
{
cout << *rits3 << " ";
++rits3;
}
cout << endl;
}
int main()
{
test5();
return 0;
}
注意反向迭代器是reverse_iterator
反向的开始是rbegin()
结束是rend()
,且开始到结束使用进行加操作。rbegin()
就是执行最后一个元素的,不是“ \0 ”,而rend()
是执行第一个元素的前一个位置。
范围for
范围for,这个是C++11才出来的,现在被广泛地使用
void test4()
{
string s1("Hello World");
for (auto s : s1)
{
cout << s << " ";
}
cout << endl;
}
int main()
{
test4();
return 0;
}
其中for (auto s : s1)
就是范围for的使用,auto是自动类型,相当于直接把s1的值赋值给了s,范围for的底层实现还是迭代器。参考汇编:
范围for既然的底层实现既然都是迭代器的话,那么也可以像迭代器那样在遍历的时候去做修改,不过要使用引用才行。
void test4()
{
string s1("Hello World");
for (auto& s : s1)
{
s++;
}
for (auto s : s1)
{
cout << s << " ";
}
cout << endl;
}
int main()
{
test4();
return 0;
}
一个类如果不支持迭代器就不支持范围for,因为范围for的底层使用的也是迭代器
不仅如此,范围for也是不支持像迭代器那样倒着遍历的
at
at的用法和方括号差不多,主要区别在于越界的检查
void test6()
{
string s1("Hello World");
cout << s1.at(1) << endl;
cout << s1[1] << endl;
}
int main()
{
test6();
return 0;
}
下面是两个越界的报错:
可以看到对于上面的oparator[]来说若是产生了一个越界访问的话就直接报出【断言错误】了
对于at()来说虽然也是弹出了警告框,但是呢这个叫做【抛异常】
string所以的成员函数都在文档里面可以查到,总共100多个,不能每个都记下,所以学会看文档是十分重要。