C语言输入有fgets,gets,getchar,scanf,sscanf,fscanf等函数,但这里先只讨论格式化的输入,即后面的三个。其中的格式化支持部分正则表达式。
#include "stdio.h"
int scanf( const char *format [,argument]... );
int sscanf (const char *str,const char * format,........);
int fscanf (FILE *stream,const char * format,........);
其中scanf 从控制终端(即stdin)输入,而这个输入是一个缓冲区。因此,它从缓冲区顺序取数据,而不支持随机读。
而fscanf 从文件输入,其中它把文件看成缓冲区。
sscanf 从指定字符串str中读取数据,它把字符串看成缓冲区。
1.scanf的处理过程
scanf函数将缓冲区的数据与其格式说明参数字符串逐一进行匹配,只有匹配正确后才会取出,否则还是在缓冲区中。
而函数只有在:格式化字符串(即函数中的format)匹配到末尾,或遇“非法字符”即缓冲区的头数据与格式参数中指定类型不匹配。
而如果正确匹配,由于缓冲区中没有数据,则函数不返回,一直等待缓冲区的输入。
函数的返回值为:被转换输入值的数目。
一般情况下,空格,回车,tab、制表符等字符不会被写入指定的空间,即scanf把这些字符看成是格式之间的分隔,自动把它们跳过。只有在%c的情况下才不能跳过这些字符。
1.1 正确匹配,由于缓冲区中没有数据,则函数不返回,一直等待缓冲区的输入
#include "stdio.h"
void main()
{
int n=34;
int num=7;
int ret;
ret=scanf("%d%d",&num,&n);
printf("ret=%d,%d\n",ret,num);
//scanf("n=%d,num=%d\n",&n,&num);
//printf();
}
1.2格式字符串中还有其它字符
这种%s,%s的处理与整型的不一样,若为字符串,如果有特殊要求,一般用正则表达式中的匹配。
1.3 %[xxx]用于字符串的限定选入
根据给定组合xxx的字符从输入中读取一串字符,注意这里没有%s或%[]s了。参数必须指向一个足够大的字符数组。当遇到第一个不在给定组合中出现的字符时,输入就停止,并在后面自动加上NUL终止符。
如:代码%[abc]表示字符组合包括a、b和c。
%[a-zA-Z] 表示匹配a到z和A-Z中任意字符,
%[aB‘] 匹配a、B、‘中一员,贪婪性
1.4 %[^a] 匹配非a的任意字符
列表以一个^字符开头,表示字符组合是所列字符的补集 ,所以%[^abc]表示字符组合为a、b、c之外的所有字符。一旦遇到abc中的任意字符,则该字符串终止,并在其后加上NULL., 注意,当转到终止符后,%[^abc】,那个字符串是还在缓冲区中的,如果后面的字符串不需要它,则要用1.5的格式过滤它。
右方括号也可以出现在字符列表中,但它必须是列表的第一个字符。
至于横杠是否用于指定某个范围的字符(例如%[a-z]),则因编译器而异。
1.5%*c或%*s或%md(m为宽度)用于过滤,或跳过部分字符
%后的“*”附加说明符,用来表示跳过它相应的数据。例如:
scanf(“%2d%*3d%2d”,&a,&b);
如果输入如下信息:1234567。将12赋给a,67赋给b。第二个数据”345”被跳过不赋给任何变量。
给定一个字符串““hello, world”,仅保留world。(注意:“,”之后有一空格)
sscanf(“hello, world”, "%*s%s", buf); printf("%s/n", buf); 结果为:world %*s表示第一个匹配到的%s被过滤掉,即hello被过滤了 如果没有空格则结果为NULL。 |
2输入数据所占列宽,系统自动按它截取所需数据。如:
scanf(“%3d%3d”,&a,&b);
输入:123456
系统自动将123赋给a,456赋给b。
取最大长度为4字节的字符串。
sscanf("123456 ", "%4s", str);
printf("str=%s\n", str);
4.输入数据时不能规定精度,
scanf(“%7.2f”,&a);
是不合法的,不能企图输入:12345.67而使a的值为12345.67。
5.%c
用“%c”格式输入字符时,空格字符和转义字符都作为有效字符输入。
scanf(“%c%c%c”,&c1,&c2,&c3);
如输入:a b c 。字符’a’赋给c1,字符(空格)’ ’赋给c2,字符’b’ 赋给c3。
6.sscanf与scanf类似
const char* p = "12232114687ABC12356";
sscanf(p,"%[123]",buf); // 就把是'1'或'2'或'3'的字读读到buf中,直到遇到一个不是'1'且不是'2'且不是'3'的字符,于是执行后buf应该是"1223211";
%[123]等同于%[231],等同于%[321]……,列表中的顺序是无所谓的;
%[123]也等同于%[1-3]或%[3-1],也就是“1至3”,对于连续的字符列表这样写就很简单,比如%[a-z]等同%[abc…省略…z];
想想看,%[3-14]应该等同于什么?是“3至14”吗?
不是,因为[]中的是字符,而不是数字,所以是3-1,即1-3,所以%[3-14]应该等同于%[3214],等同于%[1234];
同理,想只取字母,那就可以写成%[A-Za-z];
如果列表的第一个字母是^,那么正好相反,比如%[^A-Za-z]的意思就是取字母之外的所有字符。
对于字符串"abDEc123"如果想按照字母和数字读到两个字符串中就应该是 "%[a-zA-Z]%[0-9]",buf1,buf2 ;
假如我想取一行字符,该怎么办?"%s"是不行的,因为%s遇到空白字符(空格、制表符、\r、\n)就结束了,所以可以写成 "%[^\n]%*c",%[^\n]的作用刚才讲过了,就是读\n之外的所有字符,也就是说读到\n为止,%*c的作用就是把\n去掉,否则再次读的时候一直遇到的都是\n;
所有对%s起作用的控制,都可以用于%[],比如"%*[^\n]%*c"就表示跳过一行,"%-20[^\n]"就表示读取\n前20个字符。