本人用rapidxml写一个学生信息操作的时候遇到了一个问题:一个由多个原子信息构成的属性值字符串如何取出其中单个的某个原子信息。xml文件内容如下:
<?xml version="1.0" encoding="gb2312"?>
<StudentInformation>
<StudentList>
<Student>张三 男 1001 13440069817</Student>
<Student>李四 男 1002 13440069818</Student>
<Student>玛丽 女 1003 13440069819</Student>
</StudentList>
</StudentInformation>
sscanf_s函数就能够实现这样的功能,当然介绍sscanf_s函数之前大致谈一下sscanf函数的用法。本人使用的是rapidxml,其用法就不再此赘述,可以轻易用value()得到如studentlist里第一行“张三”的信息字符串“张三 男 1001 13440069817”,这里想实现的功能是取出student的name去循环比较xml里的sudent,打印输出该student的信息
///(此处由参考得知,未经验证,可降低安全检查验证)
int _digit;
char _buf1[255];
char _buf2[255];
char _buf3[255];
char* _str=_Node->value();///此处value()值="张三 男 1001 13440069817"
_ret = sscanf(_str, "%s %s %d %s", _buf1, _buf2, &_digit,_buf3);
///_ret=3, _buf1=张三, _buf2=男 , _digit=1001,buf2=13440069817
///不难看出sscanf的返回值=参数个数
当使用sscanf_s完成同样的操作时,毫无疑问会报错,以下是能够运行的代码:
默认情况下sscanf_s取每个元素之间的分界为空格,_buf1拿的是“张三”,_buf2拿的是“男”,_buf3拿的是“13440069817”,_digit拿的是“1001”,显然三个字符串参数后面都跟了对应字节数+1的数字,个人理解这里的数字代表申请一个缓存空间去接收这些原子字符串信息,后面的+1存放字符串结束标志‘\0’,尤其注意使用%s格式对数据解析时,缓冲长度必须大于字符串长度,否则不予解析。所以建议使用的时候不确定字符串具体内容可以都默认设置为255。
sscanf_s(_str, "%s %s %d %s", _buf1,5, _buf2,3, &_digit,_buf3,12);
也可以不加空格显式标明如何取:"%4s%2s%4d%11s"表明先取四个字节"张三",再取两个字节"男",再取四个字节"1001",再取11个字节"13440069817"。
sscanf_s(_str, "%4s%2s%4d%11s", _buf1,5, _buf2,3, &_digit,_buf3,12);
如果字符串是以-作为间隔,那么可以如下使用:即取四个字节"张三",遇到‘-’则略过,再取两个字节"男",遇到‘-’则略过,再取四个字节"1001",遇到‘-’则略过,再取11个字节"13440069817"。
sscanf_s(_str, "%4s-%2s-%4d-%11s", _buf1,5, _buf2,3, &_digit,_buf3,12);
本篇内容仅为个人经验之谈,本人才疏学浅,希望各路大佬不吝指正,加以升华!
2021.7.18 补充:
对应的sprintf_s函数参数列表有整形变量时无需取地址,取地址则传入字符串中的是整形变量的地址。
2021.7.22 补充:
不能用string变量接收sscanf_s摘出的字符串,可以以char数组的形式(可能不准确,据现实验得出)。