C语言 字符串处理技巧(sscanf、strstr等用法)

之前有项目需要对日志进行大量提取和分析操作,除正则表达式这一强大的工具外,若是来不及学习正则表达式,又迫切地需要提取字符串。可以利用C语言自带的几个字符串处理函数来搞定。但必须注意符号、空格和换行符的细节问题。

sscanf的用法
    int sscanf(const char *buffer,const char *format,[argument ]...);
根据format定义的形式,截取符合该形式的值,格式化输出到之后的传入的参数中。
sscanf支持正则,功能丰富,但必须注意的是:匹配条件比较苛刻,一旦未获取到参数极易引起段错误。 一定要注意传入的必须是地址。
错误例子:
    char * test = "ABCDE10FG\n";
    int num = 0;
    sscanf(test,"ABCDEF%dFG ",num);
    printf("num is %d\n",num);
程序结果:
     写入位置 0x00000000 时发生访问冲突
一定要注意sscanf传入的必须是地址。
正确用法:
    char * test = "ABCDE10FG\n";
    int num = 0;
    sscanf(test,"ABCDEF%dFG ",&num);
    printf("num is %d\n",num);
    
sscanf截取字符串
    除截取数字比较方便外,sscanf也可截图字符串中的字符,但用法上有需要注意:
简单的%s输出格式化字符串不好用。
 举例:   
    char * test = "ABCDE10FG\n";
    int num = 0;
    char target[4];
    sscanf(test,"ABCDEF%d%sG ",%num,target);
     printf("num is :%d,targetis :%s\n",num,target);
我们期待target的值是”F“,
但实际上的输出是:”FG\n“,因为sscanf遇到%s的时候,直接将后边的所有字符串赋给了char,不会截取其中的内容,而且除了截取的内容与期望不符外,

如果字符串赋值越界,则直接引起栈错误。
错误例子:
    char * test = "ABCDE10FG\n";
    int num = 0;
    char target[1];
    sscanf(test,"ABCDEF%d%sG ",%num,target);
     printf("num is :%d,target is :%s\n",num,target);
输出结果
     Run-Time Check Failure #2 - Stack around the variable 'target' was corrupted.
因为%s的格式化输出为3个字符,赋值给字符数组造成越界。

必须指定字符串的数量才能用sscanf截取。
正确例子:
     char * test = "ABCDE10FG\n";
    int num = 0;
    char target[1];
    sscanf(test,"ABCDEF%d %1s G ",%num,target);
     printf("num is :%d,targetis :%s\n",num,target);
输出结果:     
    num is :10,targe0t is :F

这种指定数量才能格式化输出用起来比较不方便,比如截取序列号等位数不一定怎么办?

strstr的用法
    char  *strstr(const  char *str1, const char *str2);
搜索一个字符串在另一个字符串中的第一次出现。该函数返回字符串的其余部分.
举例:
    const char *test = "ABC_DEF_EFG";
    char *target = strstr(test,"_");
target中保存的字符串是”_DEF_EFG“
可用两次strstr截取关键字之间的字符串。
举例:
    const char * test = "ABC_DEF_EFG";
    char *flag_1 = NULL;
    flag_1 = strstr(test,"_");//获取第一个下划线的地址
    if ( NULL != flag_1 )
    {
        flag_2 =NULL;
        flag_2 = strstr(flag_1+1,"_");//获取第二个下划线的地址
    }
    if(flag_2 == NULL)
        return ;
    char * target = (char *)malloc(flag_2 - flag_1 - 1);
    strncpy(target , flag_1+1 , (flag_2-flag_1 -1))//获取下划线之间的内容
结果:target的内容为”DEF“

一个实现读取文本关键字的简单流程:
fopen->fseek->fgets->fclose

sprintf (buf_com, "%s\\manipulate.log\\iolog_iostat",LogPath);
    fp =  fopen(buf_com,"r");
    if(fp == NULL)
    {
        return  ERROR_NOT_OPEN_FILE;
    }
     fseek(fp,searchlen,SEEK_SET);
    while( fgets(readbuf,1024,fp))
    {
        tmppoint = head;
        dmpoint =  strstr(readbuf,"dm-");
        if(dmpoint)
        {
            int dm_num=0;
             sscanf(dmpoint,"dm-%d",&dm_num);
            printf("dm_num is %d",dm_num);

        }
    }
     fclose(fp);

本人博客园文章搬运
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值