关于Vim的模式匹配
模式开关
当使用/...或者?...对文本进行查找,或者用s/...进行替换时,模式匹配开始起作用。
大家都知道,模式匹配中有一些特殊字符,它们对如何进行字符匹配起着关键性的作用。
如果用过Perl,那你很可能会不习惯Vim里的模式书写方式。因为在默认情况下,Vim将|和()看做是原义字符,假设你想匹配a或b并把匹配放入缓存,那你要写成“/(a/|b/)”。这显然不够简炼,所以我习惯在模式串开始前使用/v来切换模式开关,前面的例子可以写成“//va|b”。
下面引用一段Vim 7的中文说明文档:
3. 魔术 /magic
某些字符在模式中是按本义出现的。它们匹配自身。然而,当前面有一个反斜杠时,这些
字符具有特殊的含义。
另外一些字符即使没有反斜杠也代表特殊的意思。它们反而需要一个反斜杠来匹配按本义
出现的自身。
一个字符是否按本义出现取决于 'magic' 选项以及下面将解释的条目。
//m //M
使用 "/m" 会使得其后的模式的解释方式就如同设定了 'magic' 选项一样。而且将忽略
'magic' 选项的实际值。
使用 "/M" 会使得其后的模式的解释方式就如同设定了 'nomagic' 选项一样。
//v //V
使用 "/v" 会使得其后的模式中所有 '0'-'9','a'-'z','A'-'Z' 和 '_' 之外的字符都
当作特殊字符解释。"very magic"
使用 "/V" 会使得其后的模式中只有反斜杠有特殊的意义。"very nomagic"
示例:
在这之后: /v /m /M /V 匹配
'magic' 'nomagic'
$ $ $ /$ 匹配行尾
. . /. /. 匹配任何字符
* * /* /* 前面匹配原的任意次重复
() /(/) /(/) /(/) 组成为单个匹配原
| /| /| /| 分隔可选分支
/a /a /a /a 字母字符
// // // // 反斜杠 (按本义)
/. /. . . 英文句号 (按本义)
/{ { { { '{' (按本义)
a a a a 'a' (按本义)
{仅 Vim 支持 /m,/M,/v 和 /V}
建议始终将 'magic' 选项保持在缺省值 - 'magic'。这可以避免移植性的麻烦。要使
模式不受该选项值的影响,在模式前面加上 "/m" 或 "/M"。
贪婪、非贪婪
Vim的模式匹配默认是贪婪的,“a.*b”匹配a和b之间的所有字符,假如一行中含有多个b,那么将一直搜索到最后一个b。比如对“axbxxbxxx”进行匹配将得到“axbxxb”。如果仅仅想匹配“axb”,那么就要使用非贪婪方式。
对于Perl,上面的例子可以使用“a.*?b”进行匹配(非贪婪),而在Vim中要写成“a./{-}b”。