用curl模拟登陆获取页面信息以及相关知识点

今天使用curl做了模拟登陆,之前没有接触过curl,也并不知道有这个东西,下面简要谈谈我在做这个模拟登陆过程中get 到的技能以及了解到的知识:    


1、CURL:curl是利用URL语法开发的开源传输工具,相当于一个模拟浏览器,可以通过post/get获取到想要的页面信息、实现文件的上传下载、操作cookies文件、通过代理服务器(代理服务器是浏览器和web服务器的一个中转站,相当于缓冲池)向服务器发送请求等,支持如FTP,FTPS,TELNET等多种文件传输协议。起初只能在命令行中使用,现在也支持PHP,并且有一个强大的函数库,里面有很多函数可以支持不同的功能。之前采集页面信息的时候用的是file_get_contents,采集完整个页面,然后再用正则匹配获取到想要的内容,对于某些登陆或者验证后才能得到的信息是获取不到的。


curl发送url请求的步骤为:curl初始化---》 设置具体的参数信息---》执行curl,并取得返回的结果---》关闭curl会话


下面就是使用curl模拟登陆获取用户信息的过程:


   
    <span style="font-size:14px;">function login_post($url, $cookie, $post){  
                    $curl = curl_init($url);//初始化
                    curl_setopt($curl, CURLOPT_URL, $url);//登录提交的地址 
                    curl_setopt($curl, CURLOPT_COOKIEJAR, $cookie); //设置Cookie信息保存在指定的文件中
                    curl_setopt($curl, CURLOPT_POST, 1);//post方式提交              
                    curl_setopt($curl, CURLOPT_POSTFIELDS, $post);//要提交的信息 
                    //var_dump(http_build_query($post));exit;//打印要post的信息
                    $data = curl_exec($curl);//执行命令
                    curl_close($curl);//关闭URL请求
    }
    function get_content($url, $cookie) {
                    $ch = curl_init($url);
                    curl_setopt($ch, CURLOPT_URL, $url);//需要获取信息的页面
                    //curl_setopt($ch, CURLOPT_HEADER, 1);//不输出头部
                    curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);//设置将获取到的信息输出在浏览器上
                    curl_setopt($ch, CURLOPT_COOKIEFILE, $cookie); //读取cookie
                    $rs = curl_exec($ch); //执行cURL抓取页面内容
                    curl_close($ch);
                    return $rs;
        }
    //设置post数据
        $post = array(
                        "uname" => "xxxxxxxx",
                        
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值