C++ 字符串分割、整行输入分割等问题
1. C++处理含分隔符的字符串
C++的输入默认使用空格、tab、换行符进行分割。当我们使用cin读取一个字符串时,默认会忽略先导所有的空格、tab、换行等分隔符,读取其后的字符,直到遇到下一个分割符停止。
1.1 相同类型(非string的含分隔符输入)
对于采用其他分割符,比如逗号等的输入,如果实际输入的数据类型不是字符串,且输入数量已知,可以采用如下的输入方式:
int a, b, c, d;
char sp;
cin >> a >> sp >> b >> sp >> c >> sp >> d;
cout << a << " " << b << " " << c << " " << d << endl;
cin过程中遇到分隔符,会结束当前变量的读取,将分隔符作为一个字符输入到sp中,接着读下一个“期待中”的整数。
但这种方式仅限于数据类型非字符串,如果要输入的分割的子串,也即数据(a,b,c,d)类型为string,那么这种方式将导致全部输入到a中;如果是字符类型,对于当前场景(输入和分隔符都是1个字符)时可行的
但是当分隔符不是单一字符时,就会出错了。(本质上相当于输入字符,但是根据输入顺序坐标过滤了分隔符号)
1.2 string 输入
对于字符串输入,我们可采取以下的方法:
1.2.1 输入检查
输入一个字符就检查是否是分隔符,如果不是,就说明是正在输入的一个字符串数据,加入到当前记录的字符串里;反之说明前一条字符串输入结束了,将当前记录的字符串加入输入列表,清空当前的字符串。
不要忘记最后一个。
vector<string>vs;
string tmp;
char x;
while (cin >> x) {
if (x != ',') tmp += x;
else {
vs.push_back(tmp);
tmp.clear();
}
}
vs.push_back(tmp);
for (auto s : vs) cout << s << " ";
cout << endl;
由于这种情况实际上不知道输入总长,要采取while (cin >> x)
的方式,所以输入结束加上文件结束符。
1.2.1 stringstream
stringstream能够将字符串转化为流,能够像cin一样将数据流“输入”赋值给其他变量。
而stringstream重载的输入操作符也是以空格进行区分的。
因此我们可以先将未分割的整个字符串输入进来,然后将其中的分隔符全部替换成空格,再构造stringstream,并“二次输入”到变量。
vector<string>vs;
string tmp,t;
cin >> tmp;
for (int i = 0; i < tmp.size();++i) {
if (tmp[i] == ',')tmp[i] = ' ';
}
stringstream ss(tmp);
while (ss >> t) {
vs.push_back(t);
}
cout << vs.size() << endl;
for (auto s : vs) cout << s << " ";
cout << endl;
可见确实被分割成了我们想要的5个字符串。
2. C++整行输入
C++整行输入可以采用getline函数:
string input;
getline(cin,input);
将一整行输入到input里。
如果需要做进一步的分割,可以以字符串input构造stringstream进行拆分。
那么getline和cin一般在应用场景上有什么区别呢?
首先,对于确定类型、确定数量的输入,实际上都可以直接cin,只要输入到预先声明的变量即可;
对于不确定数量的输入,如果只有这样的输入,或者这样不确定数量的输入在最后,而之前的输入信息都是确定的,只要将之前确定的信息输入完毕,使用while(cin>>x)
即可读取后续不确定数量的输入信息;
但是,如果不确定的输入有不止一处,例如,我们需要输入每个人的年龄和姓名,但是不预先告诉你有多少人,而是先输入一行全部是年龄,在输入一行全部是姓名,此时就应该使用getline进行读取。