今天使用curl做了模拟登陆,之前没有接触过curl,也并不知道有这个东西,下面简要谈谈我在做这个模拟登陆过程中get 到的技能以及了解到的知识:
1、CURL:curl是利用URL语法开发的开源传输工具,相当于一个模拟浏览器,可以通过post/get获取到想要的页面信息、实现文件的上传下载、操作cookies文件、通过代理服务器(代理服务器是浏览器和web服务器的一个中转站,相当于缓冲池)向服务器发送请求等,支持如FTP,FTPS,TELNET等多种文件传输协议。起初只能在命令行中使用,现在也支持PHP,并且有一个强大的函数库,里面有很多函数可以支持不同的功能。之前采集页面信息的时候用的是file_get_contents,采集完整个页面,然后再用正则匹配获取到想要的内容,对于某些登陆或者验证后才能得到的信息是获取不到的。
curl发送url请求的步骤为:curl初始化---》 设置具体的参数信息---》执行curl,并取得返回的结果---》关闭curl会话
下面就是使用curl模拟登陆获取用户信息的过程:
<span style="font-size:14px;">function login_post($url, $cookie, $post){
$curl = curl_init($url);//初始化
curl_setopt($curl, CURLOPT_URL, $url);//登录提交的地址
curl_setopt($curl, CURLOPT_COOKIEJAR, $cookie); //设置Cookie信息保存在指定的文件中
curl_setopt($curl, CURLOPT_POST, 1);//post方式提交
curl_setopt($curl, CURLOPT_POSTFIELDS, $post);//要提交的信息
//var_dump(http_build_query($post));exit;//打印要post的信息
$data = curl_exec($curl);//执行命令
curl_close($curl);//关闭URL请求
}
function get_content($url, $cookie) {
$ch = curl_init($url);
curl_setopt($ch, CURLOPT_URL, $url);//需要获取信息的页面
//curl_setopt($ch, CURLOPT_HEADER, 1);//不输出头部
curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);//设置将获取到的信息输出在浏览器上
curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie); //读取cookie
$rs = curl_exec($ch); //执行cURL抓取页面内容
curl_close($ch);
return $rs;
}
//设置post数据
$post = array(
"uname" => "xxxxxxxx",