PHP过滤了外部css如何处理,php 抓取的页面如何处理可以只保留DOM结构,去掉CSS和JS?...

我想你需要的是 php 的 DOM 模块 ... 默认有安装不用担心 ...

因为不知道你的实际应用场景是什么 ... 给你写个简单的例子吧 ...<?php

/* i heard that you need DOM ..? */

$doc = new DOMDocument();

/* i wrote a simple page ... change it to a curl result ... */

$doc->loadHTML( <<Sunyanzi's Test

Hello World

Hey Welcome

HTML_SECTION

);

/* now we should try to get something ... */

$h1Elements = $doc->getElementsByTagName( 'h1' );

/* this line prints "Hello World" ... */

foreach( $h1Elements as $h1Node )

echo $h1Node->nodeValue, PHP_EOL;

/* and this line prints "http://segmentfault.com/" ... */

echo $doc->getElementById( 'onlylink' )->getAttribute( 'href' ), PHP_EOL;

/* now i will introduce something advanced ... using XPath ... */

$xpath = new DOMXPath( $doc );

/* also prints "http://segmentfault.com/" ... locate via h1 ... */

echo $xpath->evaluate(

'string(//h1[text()="Hello World"]/following-sibling::a/@href)'

), PHP_EOL;

基本上 ... 等到你熟练掌握 XPath 之后 ... 你会发现 DOM 比正则要灵活得多 ...

php 处理 XML 的能力远远超乎你的想象 ... 有空读读手册不是坏事恩 ...

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值