正则表达式截取字符串之间的字符串(不包括首尾)

正则表达式截取字符串之间的字符串(不包括首尾)

 

- (void)viewDidLoad {
    [super viewDidLoad];
    // Do any additional setup after loading the view, typically from a nib.
    
    NSString *txt = @"abc123bcdabc234bcd";
    
    NSRegularExpression *regular = [NSRegularExpression regularExpressionWithPattern:@"(?<=abc)(.*?)(?=bcd)"
                                                                             options:NSRegularExpressionCaseInsensitive
                                                                               error:nil];
    
    NSArray<NSTextCheckingResult *> *resultArr = [regular matchesInString:txt
                                                                  options:NSMatchingReportCompletion
                                                                    range:NSMakeRange(0, txt.length)];
    
    for (NSTextCheckingResult *res in resultArr) {
        
        NSLog(@"---%@", NSStringFromRange(res.range));
        
        NSString *str = [txt substringWithRange:res.range];
        
        NSLog(@"===%@", str);
    }
}

输出:

---{3, 3}
===123
---{12, 3}
===234

解释正则表达式

?<=abc表示的是abc的后面的字符串,但不包括abc。
?=bcd表示的是bcd的前面的字符串,但不包括bcd。
()是为了方便阅读。

注意:js不支持?<=分隔符,所以网页版测试正则是无法使用?<=的。

当对一段无规则的长本文进行指定内容的获取或提取时,运用正则表达式可以有效的提升我们的代码质量,提高我们的代码效率;
 

最近开发的功能极致的发挥了正则表达式的作用,且用到了多种截取方式。故在此做下总结与记录,希望可以帮到看到此博客的人。

1.截取指定字符串之间的字符串(不含开头与结尾字符串)
       在一段文本中,我们指定了固定格式的文本。比如:

                          a=@${*||名称:NAME||input}

                          b=@${*||备注:REMARK||input}

       我们要对整段文本中固定格式间(此处为‘@${’ 与 ‘}’ 之间)的内容进行提取,则可以用如下正则:

 (?<=\\@\\$\\{)(.+?)(?=\\})
完整代码如下:

String pat = "(?<=\\@\\$\\{)(.+?)(?=\\})";
Pattern pattern = Pattern.compile(pat);
Matcher m = pattern.matcher(你要进行提取的文本内容);
while (m.find()) {
    int i = 1;
    System.out.println(m.group(i));
    i++;
}
得到结果就为:

*||名称:NAME||input
*||备注:REMARK||input

2.截取字符串之间的字符串(含开头与结尾字符)
还是在上述的一段文本中,或许我们要进行提取的这段文本中含有换行符,而正则表达式中的 ‘  . ’ 表示除换行符\n之外的任意字符,因此按照上述正则,对有换行的文本提取时便会失效。比如:


######杂七杂八的#########

 
``{||这儿是一段文本内容||内容 文本
 
换行的
 
文本}``
 
``{||示例||****}``
 
……………………
……
如上图所示,我们要截取     ``{       与       }``      之间的内容(包含开头结尾),而且此段文本中还包含换行。那么,在此处,我们可以用如下正则:

(?=\``\{)([\s\S]*?)(?<=\}\``)
完整代码如下:

String rule = "(?=\\``\\{)([\\s\\S]*?)(?<=\\}\\``)";
Pattern patter = Pattern.compile(rule);
Matcher matcher = patter.matcher(你要识别并从中提取内容的文本);
        while (matcher.find()) {
            int i = 1;
            System.out.println(matcher.group(i));
            i++;
}
执行代码得到的结果为:

``{||这儿是一段文本内容||内容 文本

换行的

文本}``

``{||示例||****}``


原文链接:https://blog.csdn.net/qq_33230345/article/details/104992725

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值