php获取div内容不用正则,正则除去一些DIV内的内容

正则去除一些DIV内的内容。

我想正则去除一些DIV的内容。div  id 或者class 带comment或者share的(comment和share是一个模糊匹配。),比如

, 
, 
等等。

下面这段测试代码,保留Main content.去除后面的评论部分。

$htmls = <<

Main content.

  • Comment:

    8/11/2012, 21:25

    Some Text

    Blah~~ Blah~~ Blah~~

    2

    0

  • Comment:

    8/11/2012, 23:08

    Other Text

    Blah~~ Blah~~ Blah~~

    4

    0

EOT;

$htmls = preg_replace('/

]*(comment|share)[^>]*>(.*?)/is', '', $htmls);

echo $htmls;

------最佳解决方案--------------------

jordan102,有没有办法根据闭包分析并删除?

------其他解决方案--------------------

Footer content.

EOT;

我是说如果后面再加一个#footer,这个footer也被去掉了。

------其他解决方案--------------------

$htmls = preg_replace('/

]*(comment

------其他解决方案--------------------

你可以下载一个simple_html来解析html代码

然后遍历所有的div,然后

1、获取div的id,检测是否包含comment或者share

1、获取div的class,检测是否包含comment或者share

有则删除这个div,最后输出处理后的html即可

------其他解决方案--------------------

share)[^>]*>(.*)/is', '', $htmls);  //贪婪匹配

------其他解决方案--------------------

jordan大哥,你确信?这样的话,什么都返回不了了……

------其他解决方案--------------------

那就没什么好办法了。除非你能知道 

 后面有些特殊字符。

------其他解决方案--------------------

引用:PHP code12345

     Footer content.
EOT;

我是说如果后面再加一个#footer,这个footer也被去掉了。

正则不行可以使用一个字符一个字符的检查嘛。正则有时也不是万能的,只有在有规律的字符串中才有用。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值