前不久是我第二次使用C语言的正则表达式库。用的时候竟发现以前用过一次的全忘了,没办法,只有从新去分析regex.h这个头文件的内容,猜着它是怎么工作的。
看来很有必要记下来,免得第三次用的时候再去猜一遍。
“regex.h”是Linux系统默认安装的一个头文件,我们就是用里面的函数来使用正则表达式的功能。
先看看它的大体流程吧:
- 定义模板字符串
- 设置要使用的语法风格
- 编译模板
- 匹配
定义模板这个不说了。设置语法风格,就是选择你要使用那一种正则表达式规则。各种不同的程序里面,对正则表达式的元字符以及一些规则的定义是不一样的。在这一个步骤,可以设置一种最适合,或者自己最熟悉的风格。编译模板,可能一部分原因是为了效率,这个不想深究。匹配,这个不用说了吧。
假设你要处理的是这样一种字符串:一串11位数字的电话号码,彼此用“;”分隔,在每个号码后面可能会有“,b”表示黑名单里的“,w”表示白名单,或者没有(如:“18753432222,b;19885812345,w;18712345678;18787654321,w”)。看如下代码:
#include <stdio.h>
#include <regex.h&g