$html = "<h1>标题1</h1><h2>内容1</h2><h2>内容2</h2><p>正文</p><p>正文</p><h1>标题2</h1><h2>内容3</h2><h2>内容4</h2><p>正文2</p>";
$html .= "<h3>标题1</h3><p>正文</p><h1>标题2</h1><h2>内容3</h2><h2>内容4</h2><p>正文2</p>";
$search = '/(<(.*?)>(.*?)<\\/(.*?)>)/si'; // 所有闭合标签和内容
// $search = '/<[^>]+>/si'; // 所有标签,仅包含标签
preg_match_all($search ,$html, $h1);
foreach ($h1[0] as $key => $item) {
// 过滤掉所有的非h1、h2等的标签
if (strstr($item, '<h') === false) unset($h1[0][$key]);
}
return array_values($h1[0]);
使用正则按顺序匹配出所有的HTML闭合标签以及内容
最新推荐文章于 2023-03-29 11:30:20 发布