要采集网站数据,实现也不难,本例就将介绍如何通过PHP的cURL库来抓取远程网页数据。
以下超简单的代码演示了如何通过PHP的cURL库来远程抓取一个网页的数据信息:
<?php
$c = curl_init();
curl_setopt($c, CURLOPT_URL, "http://code52.net/");
curl_setopt($c, CURLOPT_RETURNTRANSFER, 1);
$data = curl_exec($c);
curl_close($c);
?>
CURLOPT_RETURNTRANSFER,是个预定义常数,用于告诉cURL返回抓取回来的数据信息而非直接在浏览器中显示这些数据信息。你可以查看PHP官方手册来了解CURL预定义常数的相关信息以及他们的用途。
以上实例所返回的抓取信息将保存在变量$data中,以便进行后续操作。
小提示:
如果你要使用PHP的CURL库,你必需首先在服务器上安装这个PHP拓展。具体操作建议,可以查看PHP官方手册关于安装CURL的诸多方案。