本文参考了正则表达式匹配多行注释,并在其基础上进行了改进。
1. 匹配单行注释
例如,有下面一段代码:
#import <stdio.h> // This is a single line comment
可以使用这样的一个正则表达式来匹配:
'\/\/(.*)'
2. 匹配多行注释
例如,有下面一段代码:
/*
* This is a multi line comment
*/
可以使用下面这样的正则表达式来匹配:
'\/\*[\w\W]*?\*\/'
这里需要简单介绍一下,\/\*
匹配最开始的\*
,然后 [\w\W]
用来匹配任意一个字符。这里要注意的是.
匹配的是“匹配除了换行符以外的任意单字符”,所以这里用[\w\W]
来表示字符的全集。这里用[\s\S]
或者[\d\D]
也可以。之后的*?
用到的是非贪婪匹配。例如:
输入文本:<ruby><ruby>
如果使用的是'<.*>',则执行的是贪婪匹配(或者叫贪婪重复),匹配到的是<ruby><ruby>。
如果使用的是'<.?>',则执行的是非贪婪匹配(或者叫非贪婪重复),匹配到的是<ruby>。
然后最后的\*\/
匹配的就是注释的结束标志*/
。