// 1 初始化cURL会话
$ch = curl_init();
// 2 设置cURL选项
curl_setopt($ch, CURLOPT_URL, "https://www.baidunidian.com/"); // 要访问的URL
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); // 返回结果而不是输出
//设置跟踪页面的跳转,有时候你打开一个链接,在它内部又会跳到另外一个,就是这样理解
//curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true); // 如果需要,跟随重定向
# 2.1 设置请求的头信息
$headers['User-Agent'] = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.9; rv:33.0) Gecko/20100101 Firefox/33.0';
foreach ($headers as $n => $v) {
$headerArr[] = $n . ':' . $v;
}
curl_setopt($ch, CURLOPT_HTTPHEADER, $headerArr); //设置一个header中传输内容的数组。
# 2.2 让请求能跨过basic认证
curl_setopt($ch, CURLOPT_HTTPAUTH, CURLAUTH_BASIC);// 跨过basic认证
curl_setopt($ch, CURLOPT_USERPWD, "basic:0707");//basic 用户名:密码
# 2.3 传送Cookie,如何会员已登录 即可获取登陆状态(需要上面url处理)
// 如果你已经登录并且服务器返回了cookie
// 你可以使用这个cookie
// 这块就厉害了,可以获取 B站的登陆状态,当然了,需要在上面url里面进行处理判断。
curl_setopt($ch, CURLOPT_COOKIE, 'session_cookie_name=session_cookie_value');
# 2.4 POST请求数据
$postData = http_build_query(array(
'username' => 'your_username',
'password' => 'your_password'
));
curl_setopt($ch, CURLOPT_POST, true); // 启用POST
curl_setopt($ch, CURLOPT_POSTFIELDS, $postData); // 设置POST数据
// 3.执行cURL会话
$response = curl_exec($ch);
// 检查是否有错误发生
if(curl_errno($ch)){
echo 'cURL error: ' . curl_error($ch);
}
// 4.关闭cURL会话
curl_close($ch);
// 5.输出结果
echo $response;
PHP curl抓取网页的时候,用户登录状态
于 2024-05-06 16:39:41 首次发布
本文详细介绍了如何使用cURL进行初始化会话,设置各种选项如URL、请求头、基本认证、Cookie以及POST数据,包括跨域认证和会话管理,最后演示了执行会话并处理可能出现的错误。
摘要由CSDN通过智能技术生成