c语语言言 sscanf ,,scanf ,,fscanf正正则则表表达达式式用用法法
每种语言都对正则表达式有着不同程度的支持,在C语言中,有输入功能的这三 函数对正则表达式的支持并不强大,但是我们
还是有必要了解一下。
首先来看看他们的原型:
#include
int scanf(const char *format, ...);
int fscanf(FILE *stream, const char *format, ...);
int sscanf(const char *str, const char *format, ...);
均可以接受变参,sscanf与scanf类似,可以将标准输入 (stdin)作为输入源。最关键的部分,就是format这 参数了。它可以是
一 或者多 {%[*] [width] [{h | l | I64 | L}]type | ' ' | ' t' | ' n' | 非%符号} 。
参数解释:
1、 * 亦可用于格式中, (即 %*d 和 %*s) 加了星号 (*) 表示跳过此数据不读入. (也就是不把此数据读入参数中)
2、{a |b |c}表示a,b,c中选一,[d],表示可以有d也可以没有d 。
3、width表示读取宽度。
4 、{h | l | I64 | L}:参数的size,通常h表示单字节size,I表示2字节 size,L表示4字节size(double例外),l64表示8字节size。
5、type : 就是%s,%d之类。
6、特别的:%*[width] [{h | l | I64 | L}]type 表示满足该条件的被过滤掉,不会向目标参数中写入值
支持的集合操作:%[a-z] 表示匹配a到z 中任意字符,贪婪性(尽可能多的匹配)%[aB'] 匹配a、B、'中一员,贪婪性%[^a] 匹配非
a的任意字符,贪婪性
返回值
这三 函数返回成功匹配和分配的输入项。意思就是你在format参数列表中的格式,返回值可以比你提供的匹配项目数少 (有些
将会匹配失败)。提前匹配失败则返回0 。如果达到文件末尾,则返回EOF,当发生错误的时候也将返回EOF。你可以通过输出e
rrno来查看错误代码。
如果使用fscanf来判断文件是否结束,将会存在安全隐患,如果每次读取的时候都是匹配失败,那么返回值永远都不会是EOF。s
canf族的函数都是要先将数据读入缓冲区,然后在冲缓冲里读取。
注意:scanf族函数会忽略一行开始的空白
sscanf/scanf正正则则用用法法
%[ ] 的的用用法法::
%[ ] 表示要读入一 字符集合 , 如果 [ 后面第一 字符是 ”^” ,则表示反意思。
[ ] 内的字符串可以是 1 或更多字符组成。空字符集 ( %[] )是违反规定的,可
导致不可预知的结果。 %[^] 也是违反规定的。
%[a-z] 读取在 a-z 之间的字符串,如果不在此之前则停止,如
char s[] "hello, my friend” ; // 注意 : , 逗号在不 a-z 之间
sscanf( s, “%[a-z]”, string ) ; // string hello
%[^a-z] 读取不在 a-z 之间的字符串,如果碰到 a-z 之间的字符则停止,如
char s[] "HELLOkitty” ;// 注意 : , 逗号在不 a-z 之间
sscanf( s, “%[^a-z]”, string ) ; // string HELLO
%*[^=] 前面带 * 号表示不保存变量。跳过符合条件的字符串。
char s[] "notepad 1.0.0.1001" ;
char szfilename [32] "" ;
int i sscanf( s, "%*[^ ]", szfilename ) ; // szfilename NULL, 因为没保存
int i sscanf( s, "%*[^ ] %s", szfilename ) ; // szfilename 1.0.0.1001
%40c 读取 40 字符
T he run-time
library does not automatically append a null terminator to the