第六章 标准库类型

6.1 标准库类型:string

头文件

#include <string>
using std::string;

定义与初始化

初始化string对象的方法比较多,下面列出最常用的几种:

#include <string>
#include <iostream>

int main(void) {
    using std::string;

    string s1;              // 默认初始化: 空串
    string s2 = "tomocat";  // s2是字面值"tomocat"的副本, 等价于s2("tomocat")
    string s3 = s2;         // s3是s2的副本, 等价于s3(s2)
    string s4(5, 'a');      // 5个a组成的字符串

    std::cout << "s1:" << s1 << std::endl;
    std::cout << "s2:" << s2 << std::endl;
    std::cout << "s3:" << s3 << std::endl;
    std::cout << "s4:" << s4 << std::endl;
}

// 输出:
s1:
s2:tomocat
s3:tomocat
s4:aaaaa

string对象还支持从C风格字符串提取子串的三个构造函数:

操作含义备注
string s(cp, n)s是cp指向的数组中前n个字符的拷贝此数组至少应该包含n个字符
string s(s2, pos2)s是string s2从下标pos2开始的字符的拷贝pos2 > s2.size(),则构造函数的行为未定义
string s(s2, pos2, len2)s是string s2从下标pos2开始len2个字符的拷贝pos2 > s2.size(),则构造函数的行为未定义,不管len2的值是多少,构造函数至多拷贝s2.size() - pos2个字符

string对象上的操作

1. 读写string

string对象提供了<<>>操作符,可用于读写:

Tips:注意这种写法在执行读取操作时,会自动忽略开头的空白(空格符、换行符和制表符等),从第一个真正的字符开始读起,直到遇到下一处空白停下。举个例子,如果用户输入" Tomo Cat ",那么最终将输出"Tomo"

#include <string>
#include <iostream>

int main(void) {
    std::string s;
    std::cin >> s;                // 将string对象读入cin, 遇到空白停止
    std::cout << s << std::endl;  // 将string对象输出到cout
}

上面的程序每次仅能读取一个单词,如果我们要读取多个string对象,那么可以写成:

#include <string>
#include <iostream>

int main(void) {
    std::string word;

    while (std::cin >> word) {  // 遇到文件结束标记或者非法输入时退出循环
        std::cout << word << std::endl;
    }
    return 0;
}

如果我们希望读取到的string对象保留输入时的空白符,应该使用getline函数,它接收一个输入流和一个string对象作为参数,函数从给定的输入流中读入文件,直到遇到换行符为止(注意换行符也会被读入),然后把所读的内容存入到string对象中去(注意不存换行符)。getline函数只要一遇到换行符就结束读取操作并返回结果,如果输入的就是一个换行符,那么返回空string。

Tips:getline函数会读取到输入的换行符,但是返回时将换行符丢弃了。

#include <string>
#include <iostream>

int main(void) {
    std::string line;

    // 每次读入一整行, 直到到达文件末尾
    while (getline(std::cin, line)) {
        std::cout << line << std::endl;
    }
    return 0;
}
2. 常用的成员函数
std::string s;
s.empty();  // 字符串s为空时返回true, 否则返回false
s.size();   // 返回字符串s中的字符个数

注意string类型的size()函数返回的是string::size_type类型,它具有如下几个特点:

  • 体现了标准库类型与机器无关的特性
  • 是一个无符号类型的值
  • 足够存放下任意string对象的大小

回顾一下前面提到的类型转换,由于size()函数返回的是一个无符号整数,因此不要混用size()函数返回值和带符号数,举个例子:

// 注意下面这段程序几乎每次都会非预期地输出error, 尽管s.size()返回一个正数, 不可能小于-1
// 但是混用带符号数和无符号数会将n转换成一个比较大的无符号数

#include <iostream>

int main() {
    std::string s = "tomocat";
    int n = -1;
    if (s.size() < n) {
        std::cout << "error" << std::endl;
    }
}
3. 比较string对象
std::string s1, s2;
s1 == s2       // 包含字符的内容和顺序都相同
s1 != s2       // 依赖于==的定义
<, <=, >, >=   // 利用字符在字段中的额顺序进行比较,且对字母的大小写敏感
4. 字符串拼接

Tips:基于历史原因,C++语言中的字符串字面值并不是标准库类型string的对象。

两个string对象可以通过加法运算符(+)或者复合赋值运算符(+=)直接拼接:

std::string s1 = "tomo";
std::string s2 = "cat";

std::string s3 = s1 + s2;  // s3是"tomocat"
s1 += s2;                  // s1变成"tomocat"

标准库允许我们将字符字面值和字符串字面值转换成string对象,前提是每个加法运算符(+)两侧的运算对象至少有一个是string:

#include <iostream>
#include <string>

int main() {
    // 正确: 两个string相加
    std::string s1 = std::string("tomo") + std::string("cat");
    std::cout << "s1:" << s1 << std::endl;

    // 正确: +号两边至少有一个string对象, 字面值字面值与字符串字面值会自动转换成string对象
    std::string s2 = "tomo" + std::string("cat") + '!';
    std::cout << "s2:" << s2 << std::endl;

    // 错误: 两个运算对象都不是string
    // std::string s3 = "tomo" + "cat";
}

// 输出:
s1:tomocat
s2:tomocat!
5. substr提取子串

Tips:substr可以提取一个string的子串。

操作含义备注
s.substr(pos, n)返回一个string,包含s中从pos开始的n个字符的拷贝pos的默认值为0,n的默认值为s.size() - pos,即拷贝从pos开始的所有字符;如果开始位置超过了string的大小,那么substr函数会抛出一个out_of_range异常,如果开始位置加上计数值大于string的大小,则substr会调整计数值只拷贝到string的末尾
6. 改变string的方法

string类型支持顺序容器的赋值运算符以及assign、insert和erase操作,除此之外还定义了额外的insert和erase版本。

操作含义备注
s.insert(pos, args)在pos之前插入args指定的字符pos可以是一个下标或一个迭代器,接受下标的版本返回一个指向s的引用,接受迭代器的版本返回指向第一个插入字符的迭代器
s.erase(pos, len)删除从pos开始的len个字符如果len被省略,则删除从pos开始直至s末尾的所有字符,返回一个指向s的引用
s.assign(args)将s中字符替换为args指定的字符返回一个指向s的引用
s.append(args)将args追加到s返回一个指向s的引用
s.replace(range, args)删除s中范围range内的字符,替换为args指定的字符range可以是一个下标和一个长度,也可以是一对指向s的迭代器,返回一个指向s的引用

注意args可以是下列形式之一(str不能与s相同,迭代器b和e不能指向s):

  • str:字符串str
  • str, pos, len:str中从pos开始最多len个字符
  • cp, len:从cp指向的字符数组的前(最多)len个字符
  • cp:cp指向的以空字符结尾的字符数组
  • n, c:n个字符c
  • b, e:迭代器b和e指定的范围内的字符
  • 初始化列表:花括号包围的,以逗号分隔的字符列表

TIps:append和assign可以使用上述的所有形式,但是replace和insert允许的args形式依赖于range和pos是如何指定的。

args类型replace(pos, len, args)replace(b, e, args)insert(pos, args)insert(iter, args)
str
str, pos, len
cp, len
cp
n, c
b2, e2
初始化列表
7. string搜索操作

Tips:string搜索函数返回string::size_type值,该类型是一个unsigned类型,用一个int或其他带符号类型来保存这些函数的返回值不是一个好主意。

搜索操作返回指定字符出现的下标,如果未找到则返回一个名为string::npos的static成员,标准库将npos定义为一个const string::size_type类型并初始化为值-1,由于npos是一个unsigned类型,此初始值意味着npos等于任何string最大的可能大小。

操作含义备注
s.find(args)查找s中args第一次出现的位置
s.rfind(args)查找s中args最后一次出现的位置
s.find_first_of(args)在s中查找args中任何一个字符第一次出现的位置
s.find_last_of(args)在s中查找args中任何一个字符最后一次出现的位置
s.find_first_not_of(args)在s中查找第一个不在args中的字符
s.find_last_not_of(args)在s中查找最后一个不在args中的字符

args必须是如下形式之一:

  • c, pos:从s中位置pos开始查找字符c,pos默认为0
  • s2, pos:从s中位置pos开始查找字符串s2,pos默认为0
  • cp, pos:从s中位置pos开始查找指针cp指向的以空字符结尾的C风格字符串,pos默认为0
  • cp, pos, n:从s中位置pos开始查找指针cp指向的数组的前n个字符,pos和n无默认值
8. string比较操作

除了关系运算符外,标准库string类型还提供了一组compare函数,根据s是等于、大于还是小于参数指定的字符串,s.compare返回0、正数或负数。

s.compare根据参数形式共有6个版本:

参数含义备注
s2比较s和s2
pos1, n1, s2将s中从pos1开始的n1个字符与s2进行比价
pos1, n1, s2, pos2, n2将s中从pos1开始的n1个字符与s2中从pos2开始的n2个字符进行比较
cp比较s与cp指向的C风格字符串
pos1, n1, cp将s中从pos1开始的n1个字符与cp指向的C风格字符串进行比较
pos1, n1, cp, n2将s中从pos1开始的n1个字符与cp指向的C风格字符串开始的n2个字符进行比较
9. 数值转换

新标准引入了多个函数可以实现数值数据与标准库string之间的转换,如果string不能转换为一个数组,则这些函数抛出一个invalid_argument的异常,如果转换的数值无法用任何类型表示,则抛出一个out_of_range异常:

操作含义备注
to_string(val)一组重载函数,返回数值val的string表示val可以是任何算数类型,对每个浮点类型和int或更大的整型都有相应版本的to_string
stoi(s, p, b)
stol(s, p, b)
stoul(s, p, b)
stoll(s, p, b)
stoull(s, p, b)
返回s的起始子串(表示整数内容)的数值,返回值类型分别是int、long、unsigned long、 long long、unsigned long longb表示转换的基数默认值为10,p是size_t指,用于保存s中第一个非数值字符的下标,p默认为0即不保存下标
stof(s, p)
stod(s, p)
stold(s, p)
返回s的起始子串(表示浮点数内容)的数值,返回值类型分别是float、double或long double参数p的作用与整数转换函数中一样

处理string对象的单个字符

1. cctype头文件提供的字符操作函数

cctype头文件中定义了一组标准库函数用于单个字符,下面是主要的函数名及其含义:

函数名功能
isalnum©当c是字母或数字时为真
isalpha©当c是字母时为真
iscntrl©当c是控制字符时为真
isdigit©当c是数字时为真
isgraph©当c不是空格但可打印时为真
islower©当c是小写字母时为真
isupper©当c是大写字母时为真
isprint©当c是可打印字符时为真(即c是空格或c具有可视形式)
ispunct©当c是标点符号时为真(即c不是控制字符、数字、字母、可打印空白中的一种)
isspace©当c是空白时为真(即c是空格、横向制表符、纵向制表符、回车符、换行符、进纸符中的一种)
tolower©如果c是大写字母,输出对应的小写字母,否则原样输出c
toupper©如果c是小写字母,输出对应的大写字母,否则原样输出c
2. 遍历string中的字符

使用时注意:

  • string对象的下标必须大于等于0而小于s.size(),使用超出此范围的下标将引发不可预知的错误(如果s为空string对象,那么s[0]的结果是未定义的)
  • 最好使用C++11新标准提供的范围for循环语句
  • 不要混用带符号数与服务好书,因此最好设置下标类型为string::size_type
#include <iostream>
#include <string>

int main() {
    std::string s = "tomocat";

    // 传统方法
    for (std::string::size_type i = 0; i != s.size(); ++i) {
        std::cout << s[i] << std::endl;
    }

    // C++11新标准: 范围for循环
    for (auto c : s) {
        std::cout << c << std::endl;
    }
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值