不积跬步无以至千里,不积小流无以成江河

在linux C中使用正则表达式pcre

程序示例:

#include <stdio.h> 
#include <string.h> 
#include <pcre.h> 
#define OVECCOUNT 3000 
#define EBUFLEN 128 
#define BUFLEN 1024 
  
int main() 

    pcre *re; 
    const char *error; 
    int erroffset; 
    int ovector[OVECCOUNT]; 
    int rc, i; 
    char src [] = "111 <title>Hello World</title> 222";// 要被用来匹配的字符串 
    char pattern [] = "<title>(.*)</(tit)le>"; // 将要被编译的字符串形式的正则表达式 
    re = pcre_compile(pattern, // pattern, 输入参数,将要被编译的字符串形式的正则表达式 
                       0, // options, 输入参数,用来指定编译时的一些选项 
                       &error, // errptr, 输出参数,用来输出错误信息 
                       &erroffset, // erroffset, 输出参数,pattern中出错位置的偏移量 
                       NULL); // tableptr, 输入参数,用来指定字符表,一般情况用NULL 
// 返回值:被编译好的正则表达式的pcre内部表示结构 
    if (re == NULL)
    { //如果编译失败,返回错误信息 
            printf("PCRE compilation failed at offset %d: %s\n", erroffset, error); 
            return 1; 
    } 
  for( ; ; ){
    rc = pcre_exec(re, // code, 输入参数,用pcre_compile编译好的正则表达结构的指针 
            NULL, // extra, 输入参数,用来向pcre_exec传一些额外的数据信息的结构的指针 
    src, // subject, 输入参数,要被用来匹配的字符串 
                                    strlen(src), // length, 输入参数,要被用来匹配的字符串的指针 
                                    0, // startoffset, 输入参数,用来指定subject从什么位置开始被匹配的偏移量 
                                    0, // options, 输入参数,用来指定匹配过程中的一些选项 
                                   ovector,        // ovector, 输出参数,用来返回匹配位置偏移量的数组 
                                    OVECCOUNT);// ovecsize, 输入参数, 用来返回匹配位置偏移量的数组的最大大小 
// 返回值:匹配成功返回非负数,没有匹配返回负数 
        if (rc < 0)
        {         //如果没有匹配,返回错误信息 
                if (rc == PCRE_ERROR_NOMATCH) printf("Sorry, no match ...\n"); 
                else printf("Matching error %d\n", rc); 
                pcre_free(re); 
                return 1; 
        } 
        printf("\nOK, has matched ...\n\n");                           //没有出错,已经匹配 
char *substring_start=NULL;
int substring_length=0;
        for (i = 0; i < rc; i++)
        {     //分别取出捕获分组 $0整个正则公式 $1第一个() 
                substring_start = src + ovector[2*i]; 
                substring_length = ovector[2*i+1] - ovector[2*i]; 
        //字符串中substring_start字符可能很多,只打印substring_length个
                printf("$%2d: %.*s\n", i, substring_length, substring_start);
        }
    }
    pcre_free(re);       // 编译正则表达式re 释放内存 
    return 0; 
}


编译命令以及参数:
gcc -o test.c -o test -I /include -L /lib -lpcre
 
备:ovector返回的是匹配字符串的偏移,包括起始偏移和结束偏移,所以就有循环内部的2*i处理。

阅读更多
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/baidu_36649389/article/details/79950376
个人分类: linux C高级编程
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

不良信息举报

在linux C中使用正则表达式pcre

最多只允许输入30个字

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭