在面试的过程中遇到一个这样的题目:
比如有一段HTML字符串:
var string='
Test a code
I am a girl.'; 要求写一个匹配HTML 标签的正则表达式,并且替换掉所有的标签。
html标签有
这种成对的,也有这种自闭合的,更多的是这种混合了很多字符的。那要怎么把他们都匹配呢?
其实匹配html标签的正则表达式很短,如下:
]+>
就这样,没了?是的。你惊讶吗?
这个正则表达式也是收集于网络,但是我可以看懂,首先,html标签肯定是以符号结束(不管是不是自闭合),只是中间有点纠结,可能有字符,数字,引号,换行符——但是,却万万没有>,因为有它的话html标签就结束了,所以正则表达式中间是[^>]+,表示“除了>符号外的任何1个以上的字符”。
举例如下:
var string='
Test a code
I am a girl.';
正则:
var reg=/]+>/gim;
string.replace(reg,"");
输出:
Test a codeI am a girl.