深入浅出C/C++中的正则表达式库(三)——PCRE, PCRE++
写在前面:本文是《深入浅出C/C++中的正则表达式库》系列的第三篇,本文的主要内容是介绍PCRE和PCRE++,因为它们两个是很有渊源的,所以放在一起讲。
1. 什么是PCRE? 什么是PCRE++?
PCRE,全称是Perl Compatible Regular Expressions。从名字我们可以看出PCRE库是与Perl中正则表达式相兼容的一个正则表达式库。PCRE是免费开源的库,它是由C语言实现的,这里是它的官方主页:http://www.pcre.org/,感兴趣的朋友可以在这里了解更多的内容。
要得到PCRE库,可以从这里下载:http://sourceforge.net/projects/pcre/files/
PCRE++是一个对PCRE库的C++封装,它提供了更加方便、易用的C++接口。这里是它的官方主页:http://www.daemon.de/PCRE,感兴趣的朋友可以在这里了解更多的内容。
要得到PCRE++库,可以从这里下载:http://www.daemon.de/PcreDownload
2. PCRE接口介绍
(1). pcre_compile
1 2 3 4 5 6 7 8 9 10 | |
(2). pcre_exec
1 2 3 4 5 6 7 8 9 10 11 12 13 | |
3. PCRE++接口介绍
PCRE++把PCRE库封装成了两个类,一个是RE_Options, 用来指定匹配选项,一个是RE,用来提供匹配相关的接口。RE_options类在这里我就不介绍了,我主要介绍一下RE类:
(1)RE的构造函数传入正则表达式,并在构造函数中调用Init函数,将该正则表达进行编译
(2)RE的pattern()成员用来得到初始传入的正则表达式字符串
(3)RE的error()成员用来得到匹配过程中的出错信息
(4)RE的FullMatch()成员用来判断某字符串整体是否匹配指定正则表达式
(5)RE的PartialMatch()成员用来判断某字符串的部分是否匹配指定正则表达式
4. PCRE/PCRE++使用注意事项
(1)使用pcre请包含pcre.h头文件
(2)使用pcre_compile, pcre_exec后,记得调用pcre_free释放内存,以免造成内存泄露
(3)使用pcre编译的时候需要依赖libpcre.a
(4)使用pcre++请包含pcrecpp.h头文件
(5)使用pcre++,RE类的析构函数会自动释放相关内存,因此不用担心内存泄露
(6)使用pcre++编译的时候需要依赖libpcrecpp.a
(7)使用pcrecpp要使用pcrecpp命名空间
5. PCRE使用举例
下面是例程:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 | |
下面是运行结果:
1 2 3 4 5 6 | wuzesheng@wuzesheng-ubuntu:~/Program$ !g++ g++ -lpcre TestPcre.cpp -o pcre wuzesheng@wuzesheng-ubuntu:~/Program$ ./pcre "http:\/\/.*\.qq\.com" "http://www.qq.com" http://www.qq.com matches http:\/\/.*\.qq\.com wuzesheng@wuzesheng-ubuntu:~/Program$ ./pcre "http:\/\/.*\.qq\.com" "http://www.qqq.com" http://www.qqq.com doesn't match http:\/\/.*\.qq\.com |
6. PCRE++使用举例
下面是例程:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 | |
下面是运行结果:
1 2 3 4 5 6 7 8 9 | wuzesheng@wuzesheng-ubuntu:~/Program$ g++ TestPcreCpp.cpp -lpcrecpp -o pcrecpp wuzesheng@wuzesheng-ubuntu:~/Program$ ./pcrecpp Usage: ./pcrecpp pattern text wuzesheng@wuzesheng-ubuntu:~/Program$ ./pcrecpp "http:\/\/.*\.qq\.com" "http://www.qq.com" http://www.qq.com fully matches http:\/\/.*\.qq\.com wuzesheng@wuzesheng-ubuntu:~/Program$ ./pcrecpp "http:\/\/.*\.qq\.com" "http://www.qq.comiii" http://www.qq.comiii partially matches http:\/\/.*\.qq\.com wuzesheng@wuzesheng-ubuntu:~/Program$ ./pcrecpp "http:\/\/.*\.qq\.com" "http://www.qqq.comiii" http://www.qqq.comiii dose not match http:\/\/.*\.qq\.com |
以上即是关于PCRE和PCRE++库介绍的全部内容,由于内容比较多,我只介绍了一些关键的接口及其用法,如果读者朋友想更加深入的了解其它的接口,可以参考我上面提到的官方网站,另外linux下的manual也是很好的参考资料。在shell下执行man pcre和man pcrecpp便可得到很详细的资料。