正则表达式和sscanf

      在看这篇文章之前建议你先了解一下什么是正则表达式,具体不重复了,google一下能出一大堆,不过这篇文章比较好,贴个url http://unibetter.com/deerchao/zhengzhe-biaodashi-jiaocheng-se.htm,作者说30分钟能看完的不是地球人,但是我15分钟就看完了还记住了90%以上,好吧我来自火星,玩笑到此结束,下面切入正题。

      本文的命题源自于这样的一个url,protocol://ip:port/chn/mode,比如说,dv://192.168.1.253:65001/1/1。如果我要解析出来各个部分,并把它们保存到各自的变量里面要怎么做?传统的C程序员会说用strtok慢慢取得各个部分,对于要转成int的用atoi,部分C++程序员也许会放弃strtok转用std::string当中的find系列成员函数(find/find_first_of...)。是的,我以前也是这么干的,两种方法都用过,当然也包括MFC里的CString的相关成员函数。现在,一种全新的方法源自于sscanf这个C语言函数。

      无论你用C还是C++,sscanf和scanf这两个函数都不会太陌生,%d %s %f甚至%02d %.2f这些东西你也很熟,看了上面我说的正则表达式,也许你会写出这么一个正则表达式:[a-zA-Z]+://(/d{1,3}/.){3}(/d{1,3}):/d{1,5}//d{1,}//d,没错,这个正则表达式的IP部分有点问题,但是为了描述简单,暂时就这么用了。激动人心的时候到了,我要告诉你的是scanf以及sscanf实际上是支持部分正则表达式的,当然即使是到现在我依旧不敢肯定这个部分是否是ANSI的一部分,但是我的VS2005上没有问题,朋友的VS2003上也没有问题,至于VC6实在太古老暂时找不到测试。但是顺便说一句,VS2005上你用sscanf或者scanf他会出警告的,他说这两个函数不安全建议你用sscanf_s和scanf_s,我试了下推荐的两个函数又不支持这个功能了,比较囧了。

      好了,具体说说sscanf的这个扩展功能吧(暂且这么叫)。sscanf提供的这个扩展功能其实并不能真正称为正则表达式,因为他的书写还是离不开%,而且也很局限。但是作为处理我上面说的url已经是绰绰有余了。sscanf的这个扩展功能支持[]表示支付范围,{}表示重复次数,^表示取非,*表示跳过。所以上面这个url的解析可以写成下面这个样子:

char url[] = "dv://192.168.1.253:65001/1/1"

sscanf(url,"%[^://]%*c%*c%*c%[^:]%*c%d%*c%d%*c%d",protocol,ip,port,chn,type);

解释一下

先取得一个最长的字符串,但不包括字串://,于是protocol="dv/0";

然后跳过三个字符(%*c),其实就是跳过://

接着取一个字符串不包括字符串:,于是ip=192.168.1.253,这里简化处理了,IP就当个字符串来弄,而且不做检查

然后跳过冒号取端口到port,再跳过/取通道号到chn,再跳过/取码流类型到type。

      是不是觉得还不过瘾?我也觉得,接着举例。

sscanf("Phil/nChang","%[^/n]%*c%s",first_name,last_name);

解释:跳过一个换行符,取first_name和last_name

类似上面的sscanf("phil2360@gmail.com","%[^@]%*c%s",user_name,host);

 

      基本上,这个东西用的不多,但是有时候很实用,让你的代码会很简洁,但是相比正则表达式,功能又显得简陋很多,怎么用,就看个人而定了,还是那句话,不是很确定这东西是不是ANSI的,所以不考虑移植又觉得很简洁那么用吧,考虑移植那么请三思,至于正则表达式,用regex或者boost库吧,哦,我说的是C++,C#本来就带了的!

sscanf是C语言中的一个函数,用于从字符串中按照指定的格式读取数据。它的原型如下: ```c int sscanf(const char *str, const char *format, ...); ``` `str`是要解析的字符串,`format`是解析的格式字符串,后面的参数是要读取的变量。 例如,假设有一个字符串`"name: John, age: 25"`,我们可以使用sscanf来解析出名字和年龄: ```c char name[20]; int age; sscanf("name: John, age: 25", "name: %s, age: %d", name, &age); ``` 在这个例子中,`%s`表示按照字符串的格式读取,`%d`表示按照整数的格式读取。`name`和`age`分别是要读取的变量。 正则表达式是一种强大的文本匹配工具,用于在字符串中查找特定模式的内容。在C语言中,可以使用正则表达式库来实现正则表达式的功能,例如POSIX标准库中的`regex.h`。 使用正则表达式需要先编译正则表达式模式,然后使用相应的函数进行匹配操作。以下是一个简单的示例: ```c #include <stdio.h> #include <regex.h> int main() { regex_t regex; int ret; char str[] = "Hello, World!"; char pattern[] = "Hello"; ret = regcomp(&regex, pattern, 0); if (ret) { printf("Failed to compile regex\n"); return ret; } ret = regexec(&regex, str, 0, NULL, 0); if (!ret) { printf("String matches pattern\n"); } else if (ret == REG_NOMATCH) { printf("String does not match pattern\n"); } else { printf("Failed to execute regex\n"); return ret; } regfree(&regex); return 0; } ``` 在这个例子中,我们使用`regcomp`函数编译正则表达式模式,然后使用`regexec`函数匹配字符串和模式。如果匹配成功,返回值为0;如果不匹配,返回值为`REG_NOMATCH`。 以上是关于sscanf正则表达式的简单介绍,希望能对你有帮助!如果有任何疑问,请随时提问。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值