phpQuery - PHP 处理 HTML DOM 的好帮手(截取网页特定内容)

 phpQuery - PHP 处理 HTML DOM 的好帮手(截取网页特定内容)

 

phpQuery, 在 PHP 處理 HTML DOM 的好幫手阿!! 哈! 這個 project 真不錯, 尤其是對於有使用 jQuery 的人, 更容易上手阿 :p 顧名思義, 就是 PHP 的 jQuery 阿! DOM select 的語法跟 jQuery 完全一樣阿! 而且, 當然是 chainable :p 也就是說, 只有 PHP 5 能用囉 :p

目前在 stickeraction 有用到 phpQuery, 真的是很方便 :p

可以看看以下範例, 這一段是我用來抓取網頁中, rss feed url 跟 title 的。

 

php代码
  1. require 'phpQuery.php';
  2. $url = 'http://tzangms.com/blog';
  3. $html = file_get_contents($url);
  4. phpQuery::newDocument($html)->find('head');
  5. $title = pq('head > title')->text();
  6. $feed_url = pq('head > link[rel=alternate]:first')->attr('href');
  7. echo $title;
  8. echo $feed_url;

本來這個工作是直接用 simplepie 來作, 直接就可以抓到 RSS feed url 跟 RSS , 可是在抓 xuite blog 的時候卻有問題, 都抓不到 feed_url。

看了一下 xuite 的 html, 裡面有個 wptpass 這個不知名的 tag, 有人可以告訴我這是啥嗎? anyway, 總之~ 可能就是因為 xuite 的 html code 有點奇怪, 導致 simplepie 沒辦法找到 RSS feed url, 所以我才用了 phpQuery 來找 RSS feed url。

PS. 雖然在抓 xuite html 時 log 中會有一堆錯誤 … 會說 wptpass 不是合法的 tag 之類的… 不過那都是 DOMDocument 發出來的…

 

转载自http://hi.baidu.com/qfans/blog/item/8228d21bd7c11dddad6e7510.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值