php 正则过滤xml标签,php正则表达式过滤html标签属性

采集的时候有时候需要过滤掉多余的标签属性,比如 img标签过滤掉除了src属性之外的所有属性例如删除titile alt等属性以及一些脚的onclick属性等。

例如过滤除了src之外的所有属性

$str= preg_replace('/\s(?!src)[a-zA-Z] =[\'\"]{1}[^\'\"] [\'\"]{1}/iu',' $str);

上面的实例代码是过滤掉除了src属性外的所有标签属性

过滤设置过滤除了alt和src之外的所有属性,代码如下:

$str = preg_replace('/\s(?!(src|alt))[a-zA-Z] =[^\s]*/iu',' ', $str);

过滤所有html标签的属性的正则表达式:

$str = preg_replace("/]*>/i","",$str );

只过滤alt属性的正则表达式:

(\s)alt=[^\s]*

过滤所有html标签的属性的正则表达式

$search = array ("''si",  // 去掉 javascript

"']*?>'si",          // 去掉 HTML 标记

"'([\r\n])[\s] '",                // 去掉空白字符

"'&(quot|#34);'i",                // 替换 HTML 实体

"'&(amp|#38);'i",

"'&(lt|#60);'i",

"'&(gt|#62);'i",

"'&(nbsp|#160);'i"

);                    // 作为 PHP 代码运行

$replace = array ("","","\\1","\"","&",""," ");

$html = preg_replace($search, $replace, $html);

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值