php如何解决html标签没有闭合无反斜杠包裹自动补全亲测有效

 /**
     * @Description: html 自动闭合 #再也不用正则写复杂算法了 调试问题调怕了
     * @param string    $html   html
     * @param int       $len    闭合搜寻附近的标签次数 默认3个 最小1
     * @return: string 
     */
    public function subHtml($html,$len = 3)
    {
        #去除注释
        #$html = preg_replace('~<!--(?:.|\r|\n)+?-->','',$html);
        $result = '';
        $tagStack = array();
        $contents = preg_split('~(<!--(?:.|\r|\n)*?-->|<[\s\r\n]*script(?:.|\r|\n)+?<[\s\r\n]*/[\s\r\n]*script[\s\r\n]*>|<[\s\r\n]*/?[\s\r\n]*[a-z0-9]+(?:[^\'">]*?([\'"])(?:\\\\\2|(?!\2).)*?\2)*[^\'">]*>)~si', $html, -1, PREG_SPLIT_NO_EMPTY | PREG_SPLIT_DELIM_CAPTURE);
        foreach ($contents as $kkk => $tag) {
            if ($tag == "" || $kkk-1 >= 0 && ($tag == "'" || $tag == '"') && preg_match('~^<[\s\r\n]*([a-z0-9]+)[\s\r\n]*(?:[^\'">]*?([\'"])(?:\\\\\2|(?!\2).)*?\2)+[^\'">]*>$~si', $contents[$kkk-1], $match) ) continue;
            $reg = '^<!--(?:.|[\r\n])*?-->$|^<[\s\r\n]*(?:input|img|isindex|area|base|basefont|bgsound|col|embed|frame|keygen|link|meta|nextid|param|plaintext|spacer|wbr|br)(?:[^\'">]*?([\'"])(?:\\\\\1|(?!\1).)*?\1)*?[^\'">]*>$';
            #增加兼容自定义标签 <img1x src="" /> by:LingMax 
            #$reg .= '|^<[\s\r\n]*[a-z0-9]+(?:(?:[^\'">]*?)([\'"])(?:\\\\\2|(?!\2).)*?\2)*?[^\'">]*/[\s\r\n]*>$';
            if (preg_match('~'.$reg.'~si', $tag)) {
                $result .= $tag;#放行 img这种自带闭合的标签
            } else if (preg_match("~^<[\s\r\n]*/[\s\r\n]*([a-z0-9]+)[\s\r\n]*>$~si", $tag, $match)) {
                $arrb = $tagStack;
                $bz = false;
                $lsstr = '';
                for ($i=0; $i < $len; $i++) { 
                    $ls = array_pop($arrb);
                    if($ls == $match[1]){
                        $lsstr .= $tag;
                        $bz = true;
                        break;
                    }else{
                        #出现标签闭合问题 需要修补
                        $lsstr .= '<!--修补--></'.$ls.'>';
                        #array_push($tagStack, $ls);
                    }
                }
                if($bz){
                    $tagStack = $arrb;
                    $result .= $lsstr;
                }else{
                    $result .= '<!--放弃'.$tag."-->";
                }
 
            } else if (preg_match('~^<[\s\r\n]*([a-z0-9]+)[\s\r\n]*(?:[^\'">]*?([\'"])(?:\\\\\2|(?!\2).)*?\2)*[^\'">]*>$~si', $tag, $match)) {
                array_push($tagStack, $match[1]);
                $result .= $tag;
            }else {
                $result .= $tag;
            }
        }
        while (!empty($tagStack)) {
            $result .= '</' . array_pop($tagStack) . '>';
        }
        return $result;
    }

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

reg183

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值