sscanf_强大的数据读取-转换__转载

最新推荐文章于 2024-03-02 07:00:00 发布

puzierln

最新推荐文章于 2024-03-02 07:00:00 发布

阅读量373

点赞数

分类专栏： C

C 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

函数原型:

int sscanf( const char *, const char *, ...);

int sscanf(const char *buffer,const char *format,[argument ]...);

buffer存储的数据

format格式控制字符串

argument 选择性设定字符串

sscanf会从buffer里读进数据，依照format的格式将数据写入到argument里。

头文件

#include<stdio.h> 或者

#include <cstdio>

返回值

成功则返回参数数目，失败则返回-1，错误原因存于errno中。

经多次测试[来源请求]，在linux系统中成功返回的是成功转换的值的个数，例如：

sscanf("1 2 3","%d %d %d",buf1, buf2, buf3); 成功调用返回值为3，即buf1，buf2，buf3均成功转换。

sscanf("1 2","%d %d %d",buf1, buf2, buf3); 成功调用返回值为2，即只有buf1，buf2成功转换。

(注意：此处buf均为地址)

sscanf与scanf类似，都是用于输入的，只是后者以键盘(stdin)为输入源，前者以固定字符串为输入源。

格式控制符，类似于正则表达式：

sscanf的第二个参数可以是一个或多个 {%[*] [width] [{h | I | I64 | L}]type | ' ' | '\t' | '\n' | 非%符号}

注：

1、 * 亦可用于格式中, (即 %*d 和 %*s) 加了星号 (*) 表示跳过此数据不读入. (也就是不把此数据读入参数中)

2、{a|b|c}表示a,b,c中选一，[d],表示可以有d也可以没有d。

3、width表示读取宽度。

4、{h | l | I64 | L}:参数的size,通常h表示单字节size，I表示2字节 size,L表示4字节size(double例外),l64表示8字节size。

5、type :这就很多了，就是%s,%d之类。

6、特别的：%*[width] [{h | l | I64 | L}]type 表示满足该条件的被过滤掉，不会向目标参数中写入值

失败返回0 ，否则返回格式化的参数个数

支持集合操作

%[a-z] 表示匹配a到z中任意字符，贪婪性(尽可能多的匹配)

%[aB'] 匹配a、B、'中一员，贪婪性

%[^a] 匹配非a的任意字符，并且停止读入，贪婪性

例子

1. 常见用法。

char buf[512];

sscanf("123456","%s",buf);//此处buf是数组名，它的意思是将123456以%s的形式存入buf中！

printf("%s\n",buf);

结果为：123456

2. 取指定长度的字符串。如在下例中，取最大长度为4字节的字符串。

1 2	`sscanf("123456","%4s",buf);` `printf("%s\n",buf);`

结果为：1234

3. 取到指定字符为止的字符串。如在下例中，取遇到任意小写字母为止的字符串。

1 2	`sscanf("123456abcdedf","%[^a-z]",buf);` `printf("%s\n",buf);`

结果为：123456

4. 取仅包含指定字符集的字符串。如在下例中，取仅包含1到9和小写字母的字符串。

1 2	`sscanf("123456abcdedfBCDEF","%[1-9a-z]",buf);` `printf("%s\n",buf);`

结果为：123456abcdedf

当输入：　sscanf("123456abcdedfBCDEF","%[1-9A-Z]",buf);

1	`printf("%s\n",buf);`

结果为：123456BCDEF(错！！)

注：结果应该为：123456【因为遇到不是1-9或者A-Z的字符时，即遇到小写字母时，就已经结束】

5. 取到指定字符集为止的字符串。如在下例中，取遇到大写字母为止的字符串。

1 2	`sscanf("123456abcdedfBCDEF","%[^A-Z]",buf);` `printf("%s\n",buf);`

结果为：123456abcdedf

6、给定一个字符串iios/12DDWDFF@122，获取 / 和 @ 之间的字符串，

先将 "iios/"过滤掉，再将非'@'的一串内容送到buf中

1 2	`sscanf("iios/12DDWDFF@122","%*[^/]/%[^@]",buf);` `printf("%s\n",buf);`

结果为：12DDWDFF

7、给定一个字符串“hello, world”，仅保留world。

（注意：“，”之后有一空格，%s遇空格停止，加*则是忽略第一个读到的字符串）

1 2	`sscanf(“hello, world”,"%*s%s",buf);` `printf("%s\n",buf);`

结果为：world

%*s表示第一个匹配到的%s被过滤掉，即“hello,”被过滤了

如果没有空格则结果为NULL。

8、最简明的格式是tab间隔的字符串

1 2	`sscanf(“字符串1\t字符串2\t字符串3”,"%s%s%s",str1,str2,str3);` `printf("%s\t%s\t%s\n",str1,str2,str3);`

结果为：字符串1 字符串2 字符串3

sscanf及sscanf_s的常用方法，原来安全版本的函数，对参数和缓冲边界做了检查，增加了返回值和抛出异常。这样增加了函数的安全性，减少了出错的几率。
同时这也意味着在使用这些函数时，有时你不得不输入更多的关于缓冲区大小的参数，多敲几下键盘能换来更少的麻烦，值得！

下面总结了sscanf的以及sscanf_s的常用方法，也体现了“_s”版本函数与原函数的特别之处：

1、sscanf和scanf的不同是输入来源，前者是一个字符串，后者则是标准输入设备

2、sscanf的使用，以解析时间字符串为例，将字符串“2009-01-02_11:12:13”解析为整型年月日时分秒

//定义
char cc;
tm tm_temp={0};
string stime("2009-01-02_11:12:13");

(1) 必须严格按照分隔符形式匹配填写，若遇到不匹配项则终止解析

sscanf(stime.c_str(), "%4d-%2d-%2d_%2d:%2d:%2d",
  &tm_temp.tm_year,
  &tm_temp.tm_mon,
  &tm_temp.tm_mday,
  &tm_temp.tm_hour,
  &tm_temp.tm_min,
  &tm_temp.tm_sec
  );
(2) 可以不按照分割符号形式填写，字符数必须一致，例如可以正确解析“2009/01/02_11:12:13”

sscanf(stime.c_str(), "%4d%c%2d%c%2d%c%2d%c%2d%c%2d",
  &tm_temp.tm_year, &cc,
  &tm_temp.tm_mon, &cc,
  &tm_temp.tm_mday, &cc,
  &tm_temp.tm_hour, &cc,
  &tm_temp.tm_min, &cc,
  &tm_temp.tm_sec
  );

(3) 可以不按照分割符号形式填写，字符数必须一致，同上，%1s可以等同于%c

sscanf(stime.c_str(), "%4d%1s%2d%1s%2d%1s%2d%1s%2d%1s%2d",
  &tm_temp.tm_year, &cc,
  &tm_temp.tm_mon, &cc,
  &tm_temp.tm_mday, &cc,
  &tm_temp.tm_hour, &cc,
  &tm_temp.tm_min, &cc,
  &tm_temp.tm_sec
  );

(4) 可以不按照分割符形式和数量填写，类型必须一致，例如可以正确解析“2009/01/02___11:12:13”
这里使用了sscanf的正则表达式，与通用的正则表示类似但不完全相同，%*c表示忽略连续多个字符

sscanf(stime.c_str(), "%4d%*c%2d%*c%2d%*c%2d%*c%2d%*c%2d",
  &tm_temp.tm_year,
  &tm_temp.tm_mon,
  &tm_temp.tm_mday,
  &tm_temp.tm_hour,
  &tm_temp.tm_min,
  &tm_temp.tm_sec
  );

3、sscanf_s的使用

//定义
char cc[2];
tm tm_temp={0};
string stime("2009-01-02_11:12:13");

(1) 与sscanf第一种方法相同，可以使用"%4d-%2d-%2d_%2d:%2d:%2d"格式匹配解析

sscanf_s(stime.c_str(), "%4d-%2d-%2d_%2d:%2d:%2d",
   &tm_temp.tm_year,
   &tm_temp.tm_mon,
   &tm_temp.tm_mday,
   &tm_temp.tm_hour,
   &tm_temp.tm_min,
   &tm_temp.tm_sec
   );
(2) 使用%c格式对数据解析时，必须对相应的缓冲区增加长度参数，否则将会出错

sscanf_s(stime.c_str(), "%4d%c%2d%c%2d%c%2d%c%2d%c%2d",
  &tm_temp.tm_year, &cc, 1,
  &tm_temp.tm_mon, &cc, 1,
  &tm_temp.tm_mday, &cc, 1,
  &tm_temp.tm_hour, &cc, 1,
  &tm_temp.tm_min, &cc, 1,
  &tm_temp.tm_sec
  );
(3) 使用%s格式对数据解析时，缓冲长度必须大于字符串长度，否则不予解析

sscanf_s(stime.c_str(), "%4d%1s%2d%1s%2d%1s%2d%1s%2d%1s%2d",
   &tm_temp.tm_year, &cc, 2,
   &tm_temp.tm_mon, &cc, 2,
   &tm_temp.tm_mday, &cc, 2,
   &tm_temp.tm_hour, &cc, 2,
   &tm_temp.tm_min, &cc, 2,
   &tm_temp.tm_sec
   );

(4) 与sscanf一样，sscanf_s同样支持正则表达式

sscanf_s(stime.c_str(), "%4d%*c%2d%*c%2d%*c%2d%*c%2d%*c%2d",
  &tm_temp.tm_year,
  &tm_temp.tm_mon,
  &tm_temp.tm_mday,
  &tm_temp.tm_hour,
  &tm_temp.tm_min,
  &tm_temp.tm_sec
  );
通过以上对比sscanf与sscanf_s的使用，可以看出后者对缓冲区安全有了更多的考虑，从而避免了许多不经意的烦恼。

puzierln

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
sscanf_强大的数据读取-转换__转载

函数原型:int sscanf( const char *, const char *, ...);int sscanf(const char *buffer,const char *format,[argument ]...);buffer存储的数据format格式控制字符串argument 选择性设定字符串sscanf会从buffer里读进数据，依照format的格式将...
复制链接

扫一扫