这篇文章要探讨的是“scanf()函数的详解以及使用时需要注意的一些细节”。涉及scanf()函数的应用和需要注意的问题。属于C语言基础篇(持续更新
)。
scanf()(函数原型:int scanf(const char *restrict format, …))
这个函数原型不太好看出个所以然来,可以理解为(int scanf(“第一部分”, 第二部分))
一般用法:
int n = 0;
char a[100] = {0};
scanf(“%n%s”, &n, a);
scanf()
函数的作用是从输入缓存区中读取若干个对应格式的数据。“第一部分
”参数控制读取数据的个数以及类型,“第二部分
”指明读取到数据后的存储位置。该函数在读取正常的时候返回需要读取的数据个数,不正常退出的时候返回已经读取到的数据个数。(关于返回值的问题,注意事项3里面有提及)
scanf()函数的注意事项1
scanf()函数是一个“不安全函数”所以使用的时候要注意内存的溢出问题。
至于什么是不安全函数,网上对于这个概念的解释很少。我简单说一下吧!
不安全函数就是“不帮助开发者防止内存溢出的函数”。
这句话是我自己总结的,本来我想找一些权威性一点的总结,但是没找到。虽然大家都知道有这个概念存在,但百度百科上面没有,我翻墙到谷歌上面看了一下,也没有。或许不安全函数这个概念本身就是不存在的吧!只是人们喜欢这么称呼而已。因为一个函数它安不安全很多时候是和使用它的开发者有关的,即便是一个不安全的函数,我们也可以通过一些代码上面的约束使得它安全。安全和便捷一直都是把双刃剑。(与不安全函数相似的,还有信号安全函数和信号不安全函数,它们又是对于信号而已安不安全的函数了。)
我用一个例子来说明一下scanf()函数的不安全性吧!
假设有如下代码:
#include <stdio.h>
int main(void)
{
char s[1] = {0};
scanf("%s", s);
printf("s:%s\n", s);
return 0;
}
数组“s[1]
”只能存储一个元素,但是如果我在scanf()
函数要求输入阶段输入多于1个
字符的字符串呢?会发生什么?答案是“什么事情都可能发生”。
在这个例子里面,我输入了“abcdefg
”但数组“s[1]
”只能存储一个元素,所以除了第一个字符‘a
’是合法储存以外,其余的“bcdefg
”都是在占用非法内存。这种情况会不会出现内存错误报警告我不太清楚(没有遇到过),但是很明显的一点是,如果这段非法占用的内存中刚好有正在使用的内存,那么就会造成程序中其他地方出现任何可能的错误。所以什么事情都可能发生。这就是scanf()函数的不安全性了。
scanf()函数的注意事项2
在使用scanf()函数的时候,你输入的格式理论上必须和“第一部分
”参数的格式相对应(后面有说明为什么是理论上
)。
- 例如你代码是这样写的
int n = 0;
char s[100] = {0};
scanf("%d,%s", &n, s);
那么你输入的时候就必须要这样子输入:
11,abcdefg
- 当然,如果你什么格式都不写例如这样:
scanf("%d%s", &n, s);
那么默认两个参数中间要用空格符(空格键)或者缩进(Tab键)或者回车符(回车键)隔开,一般用空格符。你就应该这样输入:
11 abcdefg
其实在没有格式的时候,有些情况下参数不用空格隔开,代码还是能正常运行的。
例如你代码是这样的:
#include <stdio.h>
int main(void)
{
int n = 0;
char s[100] = {0};
scanf("%d%s", &n, s);
printf("n = %d\ts = %s\n", n, s);
return 0;
}
而你的输入是这样的:
11abc
程序还是可以正常运行的:
这是由于scanf()函数具有一定的智能性,对于有明显类型转换的两个相邻参数,scanf()可以自动识别。(所以前面我才说理论上
,虽然实际上是可以这么做,但还是正正经经的加个空格比较合适)
scanf()函数的注意事项3
scanf()函数在参数匹配的过程中,对于不匹配的类型,整个函数会直接退出,返回已经读取到的数据个数。
例如下面的例子:
#include <stdio.h>
int main(void)
{
int a = 0, b = 0, c = 0;
printf("返回值:%d\n", scanf("%d%d%d", &a, &b, &c));
printf("a = %d\tb = %d\tc = %d\n", a, b, c);
return 0;
}
在这个例子中,如果你正常输入是没有问题的。
但是如果你非法输入就会出现这种情况:



嗯,你从第几个参数开始非法输入,后面的数据即便合法也都没有了,返回前面正常读取到的数据个数。
scanf()函数的注意事项4
当需要使用scanf()函数连续读取两个以上字符串的时候,若要在两个‘%s
’之间添加分隔符,原则上最好只使用空格字符(空格、换行符或者制表符)进行分割。
更加准确的描述应该是两个‘
%s
’之间的第一个非格式控制符(%d
,%s
,%f
)不能为空格字符以外的字符。
例如下面的例子:
#include <stdio.h>
int main(void)
{
char s1[100] = {0};
char s2[100] = {0};
int re = scanf("%s,%s", s1, s2);
printf("s1:[%s], s2:[%s], re:[%d]\t\n", s1, s2, re);
return 0;
}
当你使用‘,
’作为分隔符对两个‘%s
’进行分割时,无论怎么输入,都无法给s2赋值了。
这其实是一个编译器也无法识别的代码错误写法。造成这个问题的原因主要有以下三点。
- scanf()在进行字符串读取时只会终止于空格字符(空格、换行符或者制表符)。
- scanf()在进行字符串读取时遇到空格字符会结束该字符串的读取,且结束后不会清除该空格字符(该空格字符仍然残留在输入缓存区里面)。
- scanf()在输入时必须保持输入格式与代码格式一致(就是前面提到的注意事项2)。
我们知道了前面三个前提后,现在我们来分析一下为什么s2无法被输入
首先原因1使得你必须用空格隔开两个字符串的输入,然后原因2使得用于隔开输入的空格残留了下来。这就导致了残留下来的空格符
无法和‘,
’匹配从而无法满足条件3,因为无法匹配成功scanf()
会中断返回。这就使得“scanf("%s,%s", s1, s2);”无论怎么输入,都不能给s2赋值。
其实针对上面三个原因的解决方案还是有的,我们可以改变代码为“scanf("%s ,%s", s1, s2);”,在’
,
‘前面加上一个空格
,这样在输入的时候输入"abc ,123"就可以实现两个字符串的赋值了。因为当读取s1时遇到abc
后面的空格后,结束掉s1的读取虽然会残留空格
在缓存区,但代码中需要匹配的下一个字符就是空格
,所以缓存区中的空格
和逗号’,
'都能匹配到对应的字符,这就使得s2也能够正常读取了。
或者还有一个取巧的方式也可以实现同样的功能。
scanf("%[^,], %s", s1, s2);
#include <stdio.h>
int main(void)
{
char s1[100] = {0};
char s2[100] = {0};
int re = scanf("%[^,], %s", s1, s2);
printf("s1:[%s], s2:[%s], re:[%d]\t\n", s1, s2, re);
return 0;
}
读取非’,'外的所有字符对s1进行输入,剩下的字符输入到s2。