目录
1、为什么学习string类?
string是一个字符数组,末尾也是\0结束
C语言中,字符串是以'\0'结尾的一些字符的集合,为了操作方便,C标准库中提供了一些str系列的库函数,但是这些库函数与字符串是分离开的,不太符合OOP的思想,而且底层空间需要用户自己管理,稍不留神可能还会越界访问。
注意,string不止可以放一个字节的字符。
所以,C++加入了string类
2、标准库中的string类
2.1 string类
1. 字符串是表示字符序列的类
2. 标准的字符串类提供了对此类对象的支持,其接口类似于标准字符容器的接口,但添加了专门用于操作单字节字符字符串的设计特性。
3. string类是使用char(即作为它的字符类型,使用它的默认char_traits和分配器类型(关于模板的更多信息,请参阅basic_string)。
4. string类是basic_string模板类的一个实例,它使用char来实例化basic_string模板类,并用char_traits和allocator作为basic_string的默认参数(根于更多的模板信息请参考basic_string)。
5. 注意,这个类独立于所使用的编码来处理字节:如果用来处理多字节或变长字符(如UTF-8)的序列,这个类的所有成员(如长度或大小)以及它的迭代器,将仍然按照字节(而不是实际编码的字符)来操作。
总结:
1. string是表示字符串的字符串类
2. 该类的接口与常规容器的接口基本相同,再添加了一些专门用来操作string的常规操作。
比特就业课
3. string在底层实际是:basic_string模板类的别名,typedef basic_string<char, char_traits, allocator>string;
4. 不能操作多字节或者变长字符的序列。
2.2 string类的常见接口声明
这里只是介绍常见接口,还有一些接口用到时再去文档中查找
2.2.1 string类的常见构造
在这里介绍一下第三点中的npos
npos就是无符号整型的最大值,在第三点中作为缺省值
只要一个函数缺省值给了npos,那么不给值的时候就会操作到string末尾
2.2.2 string类对象的访问及遍历操作
第一种遍历方式,使用operator[]
operator[]如果是普通的string调用,是可读可写的,如果是const的string调用,是只读的
第二种遍历方式,使用迭代器
如何容器内部都有迭代器
end即返回\0的位置(即最好一个有效位置的下一个)
不同编译器的迭代器类型是不同的
第三种遍历方式,范围for
再看看其他迭代器
注意:4中迭代器中,若迭代器的类型不同是无法比较的,因为类型不同
后面4个c开头的,是返回对应版本的const迭代器,但是前面4个也是既可以返回普通的,也可以返回const的,所以c开头的4个通常不被使用
可用sort对string按字典序进行排序(通过迭代器),在C++中,库函数用到迭代器都是左闭右开
2.2.3 string类对象的容量操作
string是会慢慢扩容的,且是按1.5倍扩容的
实际上这里的capacity会比实际开出来的空间少一个,因为要预留一个给\0
可为什么第一次是两倍扩容,后面是1.5倍扩容呢?
此时会发现当string中的字符少于15个字符时会把字符存在_Buf中,而当字符多于15个后,会把字符存到_Ptr中。其实这把不算是一次扩容,因为当字符少于或等于15个时,并不会去堆上开空间,而是把字符存在对象本身,而多于15个后,才会去堆上开空间(这只是vs上才这样,因为如何扩容C++标准并没有规定,取决于编译器如何实现)
但这样频繁的扩容是会造成损耗的,如果能提前给定要用的空间当然最好
reserve和resize就是解决这个问题的
若要改变缩容,即缩小capacirty,则使用shrink_to_fit
让string的size与capacity相等
注意:
1. size()与length()方法底层实现原理完全相同,引入size()的原因是为了与其他容器的接口保持一致,一般情况下基本都是用size()。
2. clear()只是将string中有效字符清空,不改变底层空间大小。
3. resize(size_t n) 与 resize(size_t n, char c)都是将字符串中有效字符个数改变到n个,不同的是当字符个数增多时:resize(n)用0来填充多出的元素空间,resize(size_t n, char c)用字符c来填充多出的元素空间。注意:resize在改变元素个数时,如果是将元素个数增多,可能会改变底层容量的大小,如果是将元素个数减少,底层空间总大小不变。
4. reserve(size_t res_arg=0):为string预留空间,不改变有效元素个数,当reserve的参数小于string的底层空间总大小时,reserver不会改变容量大小。
2.2.4 string类对象的修改操作
c_str另外一个只要用法就是让string能够使用C语言的一些接口
2.2.5 补充几个接口
assign与operator=类似,相当于赋值
replace是替换
但这样子是不好的,因为这样子会多次扩容,而扩容通常会开一块新的空间,将原先的值拷贝进去
这是用空间换时间的做法
at与operator[]类似,区别在于operator[]若越界了,是直接中断程序较暴力,而若at越界了是抛异常