转自http://blog.csdn.net/xuexiacm/article/details/8101859
cin.get,cin.getline等函数深入分析
很多初学者都认为cin函数是一个很简单的函数,其实不然!cin函数有很多需要了解的知识(比如:cin的返回值是什么,cin提供了哪些成员函数且分别是什么作用,如cin.clear(),cin.ignore(), cin.fail(), cin.good()等等),如果没有很好的掌握,在使用的时候很可能会出问题却不知其原因!而且很多人也确确实实遇到过不少问题,以下是几个简单的例子:程序
- #include <iostream>
- using namespace std;
- int main(){
- intm, n;
- cin>>m;
- cin>>n;
- return0;
}测试情况:如果用户每次都输入两个合法的数,程序不会出问题!但是如果用户第一次输入时给一个非法的输入,比如说输入一个字符'a',你会发现程序不会再执行第二条输入语句。似乎有点奇怪!! 程序2:#include <iostream>
- using namespace std;
- int main(){
- charstr[8];
- cin.getline(str,5);
- cout<<str<<endl;
- cin.getline(str,5);
- cout<<str<<endl;
- return0;
}程序的功能很简单,就是输入一个字符串再输出,再次输入一个字符串输出。程序执行情况:测试一:abcd (回车)abcd (输出)efgh(回车)efgh (输出)当用户第一次输入的字符串字符数小于4时,程序执行正常! 测试二:abcdefgh (回车)abcd (输出) (输出-换行)当用户第一次输入的字符数字符数大于4时,第一个字符串接受输入的前四个字符,而第二次的输入操作没有执行,第二个字符串输出为空。似乎也很奇怪!!!其实在很多时候都会遇到诸如此类的问题,如果不熟悉程序输入的原理和cin等一些函数的原理就不知道怎么解决!我在这里做一个简单的介绍,也许介绍得不是很准确和全面,或者存在一些误解,请大家包涵! 输入操作的原理与前一节中提到的scanf函数一样,程序的输入都建有一个缓冲区,即输入缓冲区。一次输入过程是这样的,当一次键盘输入结束时会将输入的数据存入输入缓冲区,而cin函数直接从输入缓冲区中取数据。正因为cin函数是直接从缓冲区取数据的,所以有时候当缓冲区中有残留数据时,cin函数会直接取得这些残留数据而不会请求键盘输入,这就是例子中为什么会出现输入语句失效的原因! cin的一些输入函数和操作符cin is a extern istream object。提供了很多可用的成员函数和重载的操作符,如:cin<<,cin.get(), cin.getline()等。下面我们来了解一下这几个函数: 一.cin<<该操作符是根据后面变量的类型读取数据。输入结束条件 :遇到Enter、Space、Tab键。(这个很重要!)对结束符的处理 :丢弃缓冲区中使得输入结束的结束符(Enter、Space、Tab) 读字符的情况:程序3:
- #include <iostream>
- using namespacestd;
- int main(){
- char c1, c2;
- cin>>c1;
- cin>>c2;
- cout<<c1<<""<<c2<<endl;
- return 0;
- }测试一输入:a[Enter]b[Enter]输出:a b 测试二输入:a b[Enter]输出:a b 读字符串的情况:程序4:#include <iostream>
- using namespace std;
- int main(){
- charstr1[10], str2[10];
- cin>>str1;
- cin>>str2;
- cout<<str1<<endl;
- cout<<str2<<endl;
- return0;
}测试一输入:abcd[Enter]efgh[Enter]输出:abcdefgh【分析】输入遇到回车符结束,很正常。 测试二输入:abcd efgh输出:abcdefgh【分析】第一次读取字符串时遇到空格则停止了,将abcd读入str1,并舍弃了空格,将后面的字符串给了第二个字符串。这证明了cin读入数据遇到空格结束;并且丢弃空格符;缓冲区有残留数据室,读入操作直接从缓冲区中取数据。
二.cin.get()该函数有三种格式:无参,一参数,二参数即cin.get(),cin.get(char ch), cin.get(array_name, Arsize) 读取字符的情况:输入结束条件:Enter键对结束符处理:不丢弃缓冲区中的Entercin.get() 与 cin.get(char ch)用于读取字符,他们的使用是相似的,即:ch=cin.get() 与 cin.get(ch)是等价的。程序5:
- #include<iostream>
- using namespacestd;
- int main(){
- char c1, c2;
- cin.get(c1);
- cin.get(c2);
- cout<<c1<<""<<c2<<endl; // 打印两个字符 cout<<(int)c1<<""<<(int)c2<<endl; // 打印这两个字符的ASCII值
- return 0;
}测试一输入:a[Enter]输出:a 97 10【分析】会发现只执行了一次从键盘输入,显然第一个字符变量取的'a',第二个变量取的是Enter(ASCII值为10),这是因为该函数不丢弃上次输入结束时的Enter字符,所以第一次输入结束时缓冲区中残留的是上次输入结束时的Enter字符! 测试二输入:a b[Enter]输出:a 97 32【分析】显然第一个字符变量取的'a',第二个变量取的是Space(ASCII值为32)。原因同上,没有丢弃Space字符。 读取字符串的情况:cin.get(array_name, Arsize)是用来读取字符串的,可以接受空格字符,遇到Enter结束输入,按照长度(Arsize)读取字符, 会丢弃最后的Enter字符。程序6:#include<iostream>
- using namespacestd;
- int main (){
- char a[20];
- cin.get(a, 10);
- cout<<a<<endl;
- return 0;
}测试一输入:abc def[Enter]输出:abc def【分析】说明该函数输入字符串时可以接受空格。 测试二输入:1234567890[Enter]输出:123456789【分析】输入超长,则按需要的长度取数据。 程序7:#include <iostream>
- using namespacestd;
- int main (){
- char ch, a[20];
- cin.get(a, 5);
- cin>>ch;
- cout<<a<<endl;
- cout<<(int)ch<<endl;
- return 0;
}测试一输入:12345[Enter]输出:123453【分析】第一次输入超长,字符串按长度取了"1234",而'5'仍残留在缓冲区中,所以第二次输入字符没有从键盘读入,而是直接取了'5',所以打印的ASCII值是53('5'的ASCII值)。 测试二输入:1234[Enter]a[Enter]输出:123497【分析】第二次输入有效,说明该函数把第一次输入后的Enter丢弃了!
三.cin.getline()cin.getline()与 cin.get(array_name,Arsize)的读取方式差不多,以Enter结束,可以接受空格字符。按照长度(Arsize)读取字符, 会丢弃最后的Enter字符。但是这两个函数是有区别的:cin.get(array_name, Arsize)当输入的字符串超长时,不会引起cin函数的错误,后面的cin操作会继续执行,只是直接从缓冲区中取数据。但是cin.getline()当输入超长时,会引起cin函数的错误,后面的cin操作将不再执行。(具体原因将在下一部分"cin的错误处理"中详细介绍)程序8:
- #include <iostream>
- using namespace std;
- int main (){
- charch, a[20];
- cin.getline(a,5);
- cin>>ch;
- cout<<a<<endl;
- cout<<(int)ch<<endl;
- return0;
}测试输入:12345[Enter]输出:1234-52
【分析】与cin.get(array_name,Arsize)的例程比较会发现,这里的ch并没有读取缓冲区中的5,而是返回了-52,这里其实cin>>ch语句没有执行,是因为cin出错了!下一部分将详细介绍。
在前一节中我们有几个例子中提到了cin函数出错,以致不再执行读操作(程序8)。而且我们经常会看到程序中会出现cin.clear(),cin.ignore(), cin.fail()等函数。这些函数都是与cin的错误处理有关的。这一节我们来分析一下cin的错误处理机制,并且学习几个重要的函数:cin.fail(), cin.bad(), cin.good(), cin.clear(), cin.ignore()等。
程序执行时有一个标志变量来标志输入的异常状态,其中有三位标志位分别用来标志三种异常信息,他们分别是:failbit,eofbit,badbit。这三个标志位在标志变量中是这样分配的:
____________________________________
| 2 | 1 | 0 |
| failbit | eofbit | badbit |
|___________|__________|___________|
看一下这几个标志位的作用(引用msdn):
badbit, to record a loss of integrity of the stream buffer.
eofbit, to record end-of-file while extracting from a stream.
failbit, to record a failure to extract a valid field from a stream.
In addition, a useful value is goodbit, where no bits are set.
接下来我么看几个ios类的数据定义(引用msdn):
typedef T2 iostate;
static const iostate badbit, eofbit, failbit, goodbit;
这里ios类定义了这四个常量badbit, eofbit, failbit, goodbit,其实这四个标志常量就是取对应标志位的掩码,也即输入的四种异常情况!
以上四个常量对应的取值为:
ios::badbit 001 输入(输出)流出现致命错误,不可挽回
ios::eofbit 010 已经到达文件尾
ios::failbit 100 输入(输出)流出现非致命错误,可挽回
ios::goodbit 000 流状态完全正常, 各异常标志位都为0
我们可以用输出语句来验证这几个常量的值:
cout << ios:: failbit << endl;
cout << ios:: eofbit << endl;
cout << ios:: badbit << endl;
cout << ios:: goodbit << endl;
输出的结果为:
4
2
1
0
【注意】它们不是failbit、badbit、eofbit、goodbit这四个标记位的存贮变量,而是四个标志四种异常状态的常量,其实他们就相当于取对应状态标志位的掩码。如果标志变量为flag,则flag & failbit 就取得fail标志位。
搞清楚了标志位的原理后,我们来看几个关于异常标志的函数:
1、iostate ios::rdstate()
取标志变量的值,我们可以用该函数取得整个标志变量的值,再与前面定义的标志位常量相与就可以获得对应标志位的状态。如:
- void TestFlags( ios& x ) // 获得x流的三个标志位状态
- {
- cout << ( x.rdstate( ) & ios::badbit ) << endl;
- cout << ( x.rdstate( ) & ios::failbit ) << endl;
- cout << ( x.rdstate( ) & ios::eofbit ) << endl;
- cout << endl;
- }
2、bool ios::fail()const;
1 or true if rdstate & failbit is nonzero, otherwise 0 or false. (引用msdn)
其中rdstate即通过rdstate()取得的标识变量的值,与failbit相与,即取得failbit标志位的值,如果结果非零则放回true,否则返回false。即该函数返回failbit的状态,将标志位状态通过bool值返回。
3、bool ios::bad() const;
1 or true if rdstate & badbit is nonzero; otherwise 0. (引用msdn)
与fail()相似。
4、bool ios::good()const;
1 or true if rdstate == goodbit (no state flags are set), otherwise, 0 orfalse. (引用msdn)
改函数取goodbit的情况,即三个标志位都0(即没有任何异常情况)时返回true,否则返回false。
5、voidios::clear(iostate _State=goodbit);
该函数用来重置标识变量,_State是用来重置的值,默认为goodbit,即默认时将所有标志位清零。用户也可以传进参数,如:clear(failbit),这样就将标识变量置为failbit(即:001)。
我们一般是用它的默认值,当cin出现异常,我们用该函数将所有标志位重置。如果cin出现异常,没有重置标志的话没法执行下一次的cin操作。如上一节的程序2的测试二为什么第二次输入操作没有执行?程序8中 cin>>ch 为什么没有执行?都是这个原因!!!
所以经常在程序中使用 cin.clear(), 为了重置错误标志!
6、另外还有一个函数 void ios::setstate(iostate_State);
这个函数也是用来设置标识变量的,但与clear()不同。clear()是将所有标志清零,在置以参数新的标志。而该函数不清零其他的标志,而只是将参数对应的标志位置位。这个函数不是经常使用,这里不再赘述。
在搞清楚了这几个函数后,对cin输入操作的错误处理就有了比较深的了解了。下面我们回过头来看看上一节程序8的测试,因为第一次用getline()读取字符串超长,所以导致出现异常,大家可以查看一下标志位来验证一下!所以会导致后面的 cin>>ch 语句没有执行。那我们利用前面学习的clear()函数来强制重置错误标志,看看会出现什么情况呢?
程序9:
- #include<iostream>
- using namespace std;
- int main ()
- {
- char ch, str[20];
- cin.getline(str, 5);
- cout<<"flag1:"<<cin.good()<<endl; // 查看goodbit状态,即是否有异常
- cin.clear(); // 清除错误标志
- cout<<"flag1:"<<cin.good()<<endl; // 清除标志后再查看异常状态
- cin>>ch;
- cout<<"str:"<<str<<endl;
- cout<<"ch :"<<ch<<endl;
- return 0;
- }
测试输入:
12345[Enter]
输出:
flag1:0 // good() 返回false 说明有异常
flag2:1 // good()返回true说明,clear()已经清除了错误标志
str:1234
ch :5
【分析】程序执行结束还是只执行了一次读操作,cin>>ch还是没有从键盘读取数据,但是与程序8中不同,这里打印了ch的值为'5',而且在cin>>ch之前已经清楚了错误标志,也就是cin>>ch的读操作实际上执行了。这就是前面讲的cin读取数据的原理:它是直接从输入缓冲区中取数据的。此例中,第一次输入"12345",而getline(str, 5)根据参数'5'只取缓冲区中的前4个字符,所以str取的是"1234",而字符'5'仍在缓冲区中,所以cin>>ch直接从缓冲区中取得数据,没有从键盘读取数据!
也就是当前一次读取数据出错后,如果缓冲区没有清空的话,重置错误标志还不够!要是能将缓冲区的残留数据清空了就好了哦!下面我们再来看一个很重要的函数!
7、basic_istream&ignore(streamsize _Count = 1, int_type _Delim = traits_type::eof());
function: Causes a number of elements to be skipped from the current readposition.
Parameters:
_Count, The number of elements to skip from the current read position.
_Delim, The element that, if encountered before count, causes ignore to returnand allowing all elements after _Delim to be read. (引用msdn)
这个函数用来丢弃输入缓冲区中的字符,第一参数定义一个数,第二个参数定义一个字符变量。下面解释一下函数是怎样执行的:函数不停的从缓冲区中取一个字符,并判断是不是_Delim,如果不是则丢弃并进行计数,当计数达到_Count退出,如果是则丢弃字符退出。例:cin.ignore(5, 'a'); 函数将不断从缓冲区中取一个字符丢弃,直到丢弃的字符数达到5或者读取的字符为'a'。下面我们看个程序例子:
程序10:
- #include <iostream>
- using namespace std;
- int main ()
- {
- cin.ignore(5, 'a');
- return 0;
- }
测试一输入:
c[enter]
c[enter]
c[enter]
c[enter]
c[enter]
程序结束。
【分析】程序开始时缓冲区是空的,cin.ignore()到缓冲区中取数据,没有则请求从键盘输入,每次从键盘输入一个字符,如果不是'a'则丢弃,所以该测试中共输入了5次,直到计数达到5。
测试二输入:
c[enter]
c[enter]
a[enter]
程序结束。
【分析】前面两个字符不是'a'丢弃且计数没达到5,第三次输入为'a', 丢弃该字符程序结束!
丢弃一个字符:
我们看看这个函数的默认值,第一个参数默认为1,第二个参数默认为EOF。所以cin.ignore()就是丢弃缓冲区中的第一个字符,这在程序中也是比较常用的!我们回过头看看程序5,程序5中用cin.get()读取字符,第一次读取时用回车符结束,而get函数不丢弃回车符,所以回车符仍残留在缓冲区中,导致第二次读取数据直接从缓冲区中取得回车符!这与我们最初的用以是不相符的,既然cin.get()不会自动丢弃输入结束时的回车符,这里我们学会了ignore()函数,我们就可以自己手动求其回车符啊!所以程序5可以这样改动:
程序11:
- #include <iostream>
- using namespace std;
- int main()
- {
- char c1, c2;
- cin.get(c1);
- cin.ignore(); // 用该函数的默认情况,丢弃一个字符,即上次输入结束的回车符
- cin.get(c2);
- cout<<c1<<" "<<c2<<endl; // 打印两个字符
- cout<<(int)c1<<" "<<(int)c2<<endl; // 打印这两个字符的ASCII值
- return 0;
- }
测试一输入:
a[Enter]
b[Enter]
输出:
a
b
97 98
【分析】这样程序就正常了!
清空整个缓冲区:
其实该函数最常用的方式是这样的,将第一个参数设的非常大,将第二个参数设为'\n',这样就可以缓冲区中回车符中的所有残留数据,因为一般情况下前面输入残留的数据是没有用的,所以在进行新一次输入操作前将缓冲区中所有数据清空是比较合理。
如:cin.ignore(1024, '\n');
或者:cin.ignore(std::numeric_limits<std::streamsize>::max(), '\n');