1、首先说明一下,curl的百科解释是:
PHP[2]支持的由Daniel Stenberg创建的libcurl库允许你与各种的服务器使用各种类型的协议进行连接和通讯。
libcurl目前支持http、https、ftp、gopher、telnet、dict、file和ldap协议。libcurl同时也支持HTTPS认证、HTTP POST、HTTP PUT、 FTP 上传(这个也能通过PHP的FTP扩展完成)、HTTP 基于表单的上传、代理、cookies和用户名+密码的认证。
PHP中使用cURL实现Get和Post请求的方法
2、简单来说,curl就是抓取页面的升级版,即支持GET、POST等浏览器行为,从而可以达到一个模拟浏览器操作的目的。
最简单的一个模型就是如下图所示的模型:
就是初始化,配置,取页面源代码数据,关闭。一个非常简单的例子如下所示:
<?php
//1.初始化,创建一个新cURL资源
$ch = curl_init();
//2.设置URL和相应的选项
curl_setopt($ch, CURLOPT_URL, "http://www.baidu.com/");
curl_setopt($ch, CURLOPT_HEADER, 0);
//3.抓取URL并把它传递给浏览器
curl_exec($ch);
//4.关闭cURL资源,并且释放系统资源
curl_close($ch);
?>
我们可以看到浏览器会输出百度的页面结果。我们继续深入研究如何使用curl来达到一个模拟登陆的过程,也就是模拟post的过程。
3、POST的过程比较复杂一些,但是原理和浏览器提交过程相同,简单来说,就是利用curl直接将用户名和密码(或者其他相应的参数,这个根据post页面具体讨论)提交到post指向的处理页面即可。过程如下图:
当然,我们可以看到过程几乎一样,只是在curl初始化之后,要生成一些列的post参数,然后再提交,等待返回数据。
例子如下:
<?php
/**
* Curl版本
* 使用方法:
* $post_string = "app=request&version=beta";
* request_by_curl('http://facebook.cn/restServer.php',$post_string);
* IT部落格版权所有 http://www.itbuluoge.com
*/
//设置POST值
$post_string='memberName=123&password=456';
//调用登陆函数
echo request_by_curl('http://login.ddd.cn/index.php/action/UserLogin/referer/1', $post_string);
//登陆函数
function request_by_curl($remote_server, $post_string)
{
$cookie_jar = tempnam('./tmp','JSESSIONID');
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $remote_server);
curl_setopt($ch, CURLOPT_POSTFIELDS, $post_string);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_USERAGENT, "Jimmy's CURL Example beta");
$data = curl_exec($ch);
curl_close($ch);
return $data;
}
?>
注:例子亲测有效,只是我把我自己测试的真实账号修改了一下。
上面的例子就可以显示,我们可以成功或者失败的返回数据。
但是上面有一个问题,就是失效性,也就是我们仅仅登陆成功了登陆页是没有效果的,服务器不一定保持了我们的登陆状态,所以如果我们直接取其他页面的数据,网站又会给出未登录提示,这里就需要设置一个cookie。
4、cookie设置及登陆
根据图形,我们可以分两步走,第一步模拟登陆并且设置cookie。第二步读取cookie并且加载需要登陆后访问的页面。
下面给出测试成功的例子。
<?php
/**
* Curl版本
* 使用方法:
* $post_string = "app=request&version=beta";
* request_by_curl('http://facebook.cn/restServer.php',$post_string);
* IT部落格版权所有 http://www.itbuluoge.com
*/
//设置POST值
$post_string='memberName=fdsfs&password=ddd';
//调用登陆函数
request_by_curl('http://login.ddd.cn/index.php/action/UserLogin/referer/1', $post_string);
//返回固定页面数据
echo request_url_data("http://user.ddd.cn/dispatcher.php/module/Personal/");
//登陆函数
function request_by_curl($remote_server, $post_string)
{
$cookie_jar = tempnam('./tmp','JSESSIONID');
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $remote_server);
curl_setopt($ch, CURLOPT_POSTFIELDS, $post_string);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_USERAGENT, "Jimmy's CURL Example beta");
//设置文件读取并提交的cookie路径
curl_setopt($ch, CURLOPT_COOKIEJAR, 'cookie.txt '); //保存
$data = curl_exec($ch);
curl_close($ch);
return $data;
}
function request_url_data($url)
{
//初始化,创建一个新cURL资源
$ch = curl_init();
//读取cookie
curl_setopt($ch, CURLOPT_COOKIEFILE, 'cookie.txt ');
//设置URL和相应的选项
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_HEADER, 0);
//抓取URL并把它传递给浏览器
$data=curl_exec($ch);
//关闭cURL资源,并且释放系统资源
curl_close($ch);
}
?>
根据结果,显示成功。这里我的网址和相关参数全部修改了,读者可以根据自己的需要做相应的修改。