展开全部
Html标签是支持嵌套的,怎么能够找到指定标签相对应的闭合标签是最重要的问题。
思路:先匹配最32313133353236313431303231363533e4b893e5b19e31333337616635前面的起始标签,假设是div(
1、匹配任意闭合HTML标签的正则表达式[\w]+)[^>]*?>((?[^>]*>)|\k>(?)|.*?)*\k>
2、如果只想匹配div标签,可以使用下面的正则表达式:div)[^>]*?>((?[^>]*>)|\k>(?)|.*?)*\k>
3、如果想同时匹配多个HTML标签,可以使用下面的正则表达式(div|span|h1))[^>]*?>((?[^>]*>)|\k>(?)|.*?)*\k>
4、如果想匹配包含ID的标签,可以使用下面的正则表达式:[\w]+)[^>]*\s[iI][dD]=(?["']?)footer(?(Quote)\k)[^>]*?(/>|>((?[^>]*>)|\k>(?)|.*?)*\k>)