正则表达式的最短匹配

有一次想用正则表达式从网页里面抓取一些东西出来,内容不复杂却出现不少问题。

如果内容是这样,想提取蓝色的部分:

<title a='ff33kie8'/> abcde
<title a='sse3'/> abcdef
<title a='hhs77565'/> abcdefg
<title a='743u4343525fj'/>

在 VIM 里面只要用 a='.*' 这样的正则式就可以选出来了。

但是我的要抓取的内容是下面这样,再用上面那个正则式就不行了。

<title a='ff33kie8'/> abcde <title a='sse3'/> abcdef <title a='hhs77565'/> abcdefg <title a='743u4343525fj'/>

如果用正则式  a='.*'  的话,选取的部分就是如同上面蓝色的部分。这时候就得用“最短匹配”的方式才行。

<title a='ff33kie8'/> abcde <title a='sse3'/> abcdef <title a='hhs77565'/> abcdefg <title a='743u4343525fj'/>

正则式为  a='./{-}' 才能符合我的要求,产生如上的结果。/{-} 这个符号就表示采用最短匹配的方式了。详情请看 VIM 正则表达式的帮助。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值