http://blog.csdn.net/andyddd/article/details/7542241
os从4.0开始支持正则表达式。具体涉及到的类是:
NSRegularExpression
NSTextCheckingResult
有了这个内置的ios正则表达式函数,可以不用RegexKitLite了。现在比较强的正则库是PCRE的,mac上PCRE的实现见:
http://regexkit.sourceforge.net/
两个例子说明一下NSRegularExpression的用法:
- -(void)parseString{
- //组装一个字符串,需要把里面的网址解析出来
- NSString *urlString=@"sfdsfhttp://www.baidu.com";
- //NSRegularExpression类里面调用表达的方法需要传递一个NSError的参数。下面定义一个
- NSError *error;
- //http+:[^\\s]* 这个表达式是检测一个网址的。
- NSRegularExpression *regex = [NSRegularExpression regularExpressionWithPattern:@"http+:[^\\s]*" options:0 error:&error];
- if (regex != nil) {
- NSTextCheckingResult *firstMatch=[regex firstMatchInString:urlString options:0 range:NSMakeRange(0, [urlString length])];
- if (firstMatch) {
- NSRange resultRange = [firstMatch rangeAtIndex:0];
- //从urlString当中截取数据
- NSString *result=[urlString substringWithRange:resultRange];
- //输出结果
- NSLog(@"%@",result);
- }
- }
- }
NSRegularExpression功能还是比较强大的,支持正则嵌套分组,下面是例子:
- NSString * tmp = [NSString stringWithContentsOfFile:[[NSBundle mainBundle] pathForResource:@"dreamcafe.rtf" ofType:nil]
- encoding:NSUTF8StringEncoding
- error:nil];
- // NSRange r;
- NSString *regExStr = @"hbhWxTime[\"\']><.*?>(.+?)<";
- NSError *error = NULL;
- NSRegularExpression *regex = [NSRegularExpression regularExpressionWithPattern:regExStr
- options:NSRegularExpressionCaseInsensitive
- error:&error];
- __block NSMutableArray * timeTimes = [NSMutableArray array];
- [regex enumerateMatchesInString:tmp options:0 range:NSMakeRange(0, [tmp length]) usingBlock:^(NSTextCheckingResult *result, NSMatchingFlags flags, BOOL *stop) {
- NSLog(@"timeTimes = %@",[tmp substringWithRange:[result rangeAtIndex:1]]);
- [timeTimes addObject:[tmp substringWithRange:[result rangeAtIndex:1]]];
- }];
- /*注释:
- [result rangeAtIndex:0] yuresult.range 等价
- */
- 说明:
- 匹配结果:
- NSTextCheckingResult
- !!!用range来标示匹配到的每一个子表达式/分组的。既通过substringWithRange:才能获取到某个子表达式匹配到的字符串
- range
- resultType
- numberOfRanges 匹配到的分组/子表达式个数
- – rangeAtIndex: 获取第几个子表达式