正则匹配新闻内容案例,JS和PHP

正则

'/class="content">([\s\S]*)<div class="commodity_con_small">[\s\S]*购买<\/span>.*\n\s*<\/a>.*\n\s*<\/div>([\s\S]*)<\/div>\n\s.*<script/U';

fox.风

$str=<<<EOF
<div class="content">
                                                <p></p>
                                                                <p class="image_con">
                        <img class="image lazy" data-original="https://p3a.bytecdn.cn/large/101e0004becc566829ad?imageView2/2/w/300/h/446">
                    </p>
                                                                <p></p>
                                                                <p></p>
                                                                <p class="image_con">
                        <img class="image lazy" data-original="https://p3a.bytecdn.cn/large/106400016e3e8dff8a30?imageView2/2/w/360/h/606">
                    </p>
                                                                <p></p>
                                                                <p></p>
                                                                <p class="image_con">
                        <img class="image lazy" data-original="https://p3a.bytecdn.cn/large/10650003252ddd116196?imageView2/2/w/540/h/626">
                    </p>
                                                                <p></p>
                                                                <p></p>
                                                                <p class="image_con">
                        <img class="image lazy" data-original="https://p3a.bytecdn.cn/large/102200074321904f69a0?imageView2/2/w/500/h/686">
                    </p>
                                                                <p></p>
                                                                <p></p>
                                                                <p class="image_con">
                        <img class="image lazy" data-original="https://p3a.bytecdn.cn/large/106600031e38b38c750f?imageView2/2/w/500/h/486">
                    </p>
                                                                <p></p>
                                                                <p></p>
                                                                <p class="image_con">
                        <img class="image lazy" data-original="https://p3a.bytecdn.cn/large/106600031e3a371f3fca?imageView2/2/w/740/h/686">
                    </p>
                                                                <p></p>
                                                                <p></p>
                                                                <p class="image_con">
                        <img class="image lazy" data-original="https://p3a.bytecdn.cn/large/10650003252ee42e6f74?imageView2/2/w/500/h/526">
                    </p>
                                                                <p></p>
                                                                <p></p>
                                                                <p class="image_con">
                        <img class="image lazy" data-original="https://p3a.bytecdn.cn/large/106600031e3994b19467?imageView2/2/w/580/h/486">
                    </p>
                                                                <p></p>
                                                                <p></p>
                                                                <p class="image_con">
                        <img class="image lazy" data-original="https://p3a.bytecdn.cn/large/101f000623ec8b7d1777?imageView2/2/w/380/h/646">
                    </p>
                                                                <p></p>
                                                                <p></p>
                                                                <p class="image_con">
                        <img class="image lazy" data-original="https://p3a.bytecdn.cn/large/101f000623ed1c2d1c35?imageView2/2/w/640/h/526">
                    </p>
                                                                <p></p>
                                                                <p></p>
                                                                <p class="image_con">
                        <img class="image lazy" data-original="https://p3a.bytecdn.cn/large/10650003252f59798bbb?imageView2/2/w/720/h/686">
                    </p>
                                                                <p></p>
                                                                <p></p>
                                                                <p class="image_con">
                        <img class="image lazy" data-original="https://p3a.bytecdn.cn/large/101e0004becd285acd16?imageView2/2/w/580/h/566">
                    </p>
                                                                <p></p>
                                                                <p></p>
                                                                <p class="image_con">
                        <img class="image lazy" data-original="https://p3a.bytecdn.cn/large/1065000325305485bfd1?imageView2/2/w/440/h/546">
                    </p>
                                                                <p></p>
                                                                <p></p>
                                                                <p class="image_con">
                        <img class="image lazy" data-original="https://p3a.bytecdn.cn/large/10220007432247117c16?imageView2/2/w/520/h/706">
                    </p>
                                                                <p></p>
                                                                <p></p>
                                                                <p class="image_con">
                        <img class="image lazy" data-original="https://p3a.bytecdn.cn/large/106400016e3f377b59b5?imageView2/2/w/420/h/606">
                    </p>
                                                                <p></p>
                                                                <p></p>
                                                                <p class="image_con">
                        <img class="image lazy" data-original="https://p3a.bytecdn.cn/large/10220007432381263f5e?imageView2/2/w/460/h/546">
                    </p>
                                                                <p></p>
                                                                <p></p>
                                                                <p class="image_con">
                        <img class="image lazy" data-original="https://p3a.bytecdn.cn/large/106600031e3bf7a1a366?imageView2/2/w/320/h/446">
                    </p>
                                                                <p></p>
                                                                <p></p>
                                                                <p class="image_con">
                        <img class="image lazy" data-original="https://p3a.bytecdn.cn/large/101f000623eed8a94872?imageView2/2/w/400/h/446">
                    </p>
                                                                <p></p>
                                                                                        <div class="commodity_con_small">
                            <a href="http://union.click.jd.com/jdc?e=&amp;p=AyIOZR5aEQISA1AYUyUCEg9cE18dBiJDCkMFSjJLQhBaUAscSkIBR0RJHUlSSkkFSRxTRAtOH0dHDAdVE1IdBhoDSkIeSV8iUSIcGE5Dam83fA9jVFtbNl4IRQpLZ1kXaxcHEw5dHVsQASIFVx9bFwUSDlEra3N%2FIlU7w%2B2j2re2Sc%2FxmteakGUaaxUHFAFSHVwSCxYEXBprEjJJXwpYA1BWTlcNdQlLXiI3ZSs%3D&amp;t=W1dCFBBFC1pXUwkEBwpZRxgHRQcLQ1FZAF8JUBwSB10SUxEKFhgMXgdI" class="commodity_con_small_link" _id="15630132" _code="">
                                <div class="info">
                                    <h3>四十一个历史故事,每个都值回书价</h3>
                                    <div class="inner_info">
                                        <span class="price_tag">¥30.30</span>
                                        <span class="shopName ">京东</span>
                                    </div>
                                </div>
                                <img class="image lazy" data-original="https://p3a.bytecdn.cn/large/ff10002e566e35fc44b?imageView2/2/w/350/h/350">
                                <span class="buy">购买</span>
                            </a>
                         </div>
                                        <p></p>
                                                                <p>以下为文字稿:</p>
                                                                <p>秦始皇:握草,才传了二代……</p>
                                                                <p></p>
                                                                <p>刘邦:我就知道隔壁老王会坏事。</p>
                                                                <p></p>
                                                                <p>王莽:我穿越的,到点就走,过把瘾就死!</p>
                                                                <p></p>
                                                                <p>刘秀:刘备加油!好歹你也是我们老刘家的。</p>
                                                                <p></p>
                                                                <p>刘备:果然扶不起来,阿亮,你扶我起来再试一下。</p>
                                                                <p></p>
                                                                <p>曹操:果然是三马食槽……前面的,我可以弄死你吗?</p>
                                                                <p></p>
                                                                <p>孙权:熬过了老曹家,竟然熬不过司马家</p>
                                                                <p></p>
                                                                <p>司马炎:我都说了,面由相生,丑媳妇不能娶的。</p>
                                                                <p></p>
                                                                <p>杨坚:坑爹啊!</p>
                                                                <p></p>
                                                                <p>李渊:我让我儿子替我讲二句吧。</p>
                                                                <p></p>
                                                                <p>李世民:我们被一个女的截胡了?</p>
                                                                <p></p>
                                                                <p>赵匡胤:打了一辈子,原来辽国才是亲兄弟。</p>
                                                                <p></p>
                                                                <p>耶律阿保机:都是楼上的用钱把我孙子们惯坏了。</p>
                                                                <p></p>
                                                                <p>赵构:喊了一辈子反金,原来金国才是亲兄弟。</p>
                                                                <p></p>
                                                                <p>完颜阿骨打:让你特么跟蒙古一起打我们金国!</p>
                                                                <p></p>
                                                                <p>忽必烈:我们被一个要饭和尚给灭了?!</p>
                                                                <p></p>
                                                                <p>朱元璋:都说不要跑北京去,一打就跑不掉吧。还有老子说了不让太监干政的!宫里这么多太监!</p>
                                                                <p></p>
                                                                <p></p>
                                                                <p>努尔哈赤:都说了,娶老婆不能娶叶赫那拉氏,孙子们怎么就不听呢?</p>
                                                                <p></p>
                                    </div>
        <script src="https://tms3.bytecdn.cn/dist/online/toutiao/public/js/utils/tt.player_e7859b5.js"></script>
    </div>

    <div class="tip">您已经赞过</div>
EOF;
        //        $pattern='/class="content">(.*)<script/U';
        ///class="content">([\s\S]*)<div class="commodity_con_small">[\s\S]*购买<\/span>([\s\S]*)<script/
        $pattern='/class="content">([\s\S]*)<div class="commodity_con_small">[\s\S]*购买<\/span>.*\n\s*<\/a>.*\n\s*<\/div>([\s\S]*)<\/div>\n\s.*<script/U';
        preg_match_all($pattern, $str, $content_data);
        print_r($content_data);
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值