1.去除<a>标签,保留中间的文字
原字符串 :<a href="www.baidu.com">点我跳转百度</a>
正则 :<[a|A]\s*[^>]*>(.*?)</[a|A]> 替换为 $1
结果:点我跳转百度
2.去除指定标签及其里面的内容
原字符串:<span style="color:red">红色</span>
正则:<span style="color\s*[^>]*>(.*?)</span>
结果:空
3.获取一大段html中,指定标签内的内容
原字符串:
<p class="m-th pt22"><i></i>婴儿喂养方法</p>
<div class="art-text"><p>新生婴儿喂养主要有母乳喂养、人工喂养、混合喂养等方式。其中,母乳喂养指的是用母亲的奶水喂养,是新生儿喂养的最佳方法;人工喂养则是指当母亲因为各种原因而不能进行哺乳时,可采用牛、羊等动物乳制成的婴儿奶粉或其他代乳品进行人工喂养;混合喂养指的是当母亲奶水不足,不能够多次喂养时,配合其他代乳品如牛奶、羊奶等来进行喂养。</p>
</div>
<div id="Jtab-art1">
<p class="art-tit mb16">
<span id="toc-control" class="submark slideTab">
</span>
</p>
</div>
正则:<div.*(?=art-text)(.|\n)*?</div> (取<div class="art-text"></div>之间的内容)
结果:
<div class="art-text"><p>新生婴儿喂养主要有母乳喂养、人工喂养、混合喂养等方式。其中,母乳喂养指的是用母亲的奶水喂养,是新生儿喂养的最佳方法;人工喂养则是指当母亲因为各种原因而不能进行哺乳时,可采用牛、羊等动物乳制成的婴儿奶粉或其他代乳品进行人工喂养;混合喂养指的是当母亲奶水不足,不能够多次喂养时,配合其他代乳品如牛奶、羊奶等来进行喂养。</p>
</div>