我正在尝试使用带有cURL的php脚本登录到外部网页.我是cURL的新手,所以我觉得我缺少很多东西.我找到了一些示例并将其修改为允许访问https页面.最终,我的目标是能够登录到页面并通过登录后遵循指定的链接下载.csv.到目前为止,我所拥有的是一个脚本,用于测试登录页面;该脚本如下所示:
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'https://www.websiteurl.com/login');
curl_setopt($ch, CURLOPT_POSTFIELDS,'Email='.urlencode($login_email).'&Password='.urlencode($login_pass).'&submit=1');
curl_setopt($ch, CURLOPT_POST, true);
curl_setopt($ch, CURLOPT_HEADER, false);
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true);
curl_setopt($ch, CURLOPT_COOKIEJAR, "cookie.txt");
curl_setopt($ch, CURLOPT_COOKIEFILE, "cookie.txt");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);
curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.3) Gecko/20070309 Firefox/2.0.0.3");
curl_setopt($ch, CURLOPT_REFERER, "https://www.websiteurl.com/login");
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false);
$output = curl_exec($ch);
我有几个问题.首先,有没有理由不自行重定向?我查看页面内容的唯一方法是
echo $output
即使CURLOPT_RETURNTRANSFER和CURLOPT_FOLLOWLOCATION都设置为True.
其次,页面的URL停留在“ localhost / folderName / test.php”,而不是直接指向实际的网站.谁能解释为什么会这样?由于该脚本实际上并未重定向到已登录的网页,因此我似乎无法做任何需要做的事情.
我的问题与Cookie有关吗?我的cookies.txt文件与.php脚本位于同一文件夹中. (我正在使用wampServer btw).应该在其他地方吗?
一旦能够解决这两个问题,似乎我所需要做的就是重定向到启动.csv文件下载过程的链接.
感谢您的帮助,不胜感激!
解决方法:
回答部分问题:
CURLOPT_RETURNTRANSFER TRUE to return the transfer as a string of the
return value of curl_exec() instead of outputting it out directly.
换句话说-完全按照您的描述进行.它会将响应返回到字符串,然后回显它以查看它.按照要求…
—– EDIT—–
至于您的问题的第二部分-当我将脚本的最后三行更改为
$output = curl_exec($ch);
header('Location:'.$website);
echo $output;
显示的页面地址更改为$website-在我的情况下,这是我用来存储等价于’https://www.websiteurl.com/login‘的变量
我不确定这是您要执行的操作-因为我不确定我是否了解下一步.如果您是通过登录站点重定向的,那么新地址是否不属于返回的标题的一部分?而且,您是否不需要提取该地址即可执行下一个请求(wget或其他操作)以便下载您想要获取的文件?
为此,您需要将CURLOPT_HEADER设置为TRUE,
您可以从以下位置获得最终URL
$last_url = curl_getinfo($ch, CURLINFO_EFFECTIVE_URL);
相同的链接还有一个有用的脚本,用于完全解析标头信息(当CURLOPT_HEADER == true时返回.这是nico limpica的回答.
底线:如果您将CURL指向特定站点,它将获取您的浏览器将收到的信息;这并不意味着您的浏览器就好像您将其指向该站点一样…
标签:php,curl,redirect,login,localhost
来源: https://codeday.me/bug/20191010/1885422.html