php 获取 html 中的第一段文字

function getSummary(string $string): string {
    // 把一些预定义的 HTML 实体转换为字符
    // 预定义字符是指:<,>,&等有特殊含义(<,>,用于链接签,&用于转义),不能直接使用
    $content = htmlspecialchars_decode($string);

    //去除 <video></video>
    $content = preg_replace('/<video([^>]+)>(?:(?!<\/video>)[\s\S])*<\/video>/', '', $content);
    //去除<img />
    $content = preg_replace('/<img(.*?)src=\"(.*?)\"(.*?)>/', '', $content);
    //去除 <ol> <ul>
    $content = preg_replace('/<ol>(?:(?!<\/ol>)[\s\S])*<\/ol>\n/', '', $content);
    $content = preg_replace('/<ul>(?:(?!<\/ul>)[\s\S])*<\/ul>\n/', '', $content);
    //去除空 <p></p> 空标签
    $content = preg_replace('/<p([^>]*)><\/p>(\n)*/', '', $content);
    //</p> 后增加 \n
    $content = preg_replace('/<\/p>/', "</p>\n", $content);
    $content = preg_replace('/<br \/>/', "<br />\n", $content);

    // 去除字符串中的 HTML 标签
    $content = strip_tags($content);
    $contents = explode("\n", $content);
    foreach ($contents as $item) {
        if ($item) {
            return $item;
        }
    }
    return '';
}

可能根据需求不一样会有调整,我们这里通过编辑器生成的html 包含图片,视频,表格。并且所有文字一定包含在标签中。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值