CURL爬取数据

这篇博客讲述了如何利用PHP的CURL库进行网页数据爬取。首先,需要通过CURL模拟登录https://xftsgs.yide.net/index.php 获取Cookie,然后将Cookie设置在后续请求的头部,以避免被重定向到登录页面。
摘要由CSDN通过智能技术生成

只能CURL别人的网址,
1、先账号密码登录https://xftsgs.yide.net/index.php ,
2、获取Cookie加在请求头上,之后CURL该网址的地址,就不会跳到登录页

 public function ceshi2()
    {
   
        for($i=1;$i<89;$i++){
   
            $page=$i;
            //抓取地址
            $url3='https://xftsgs.yide.net/index.php?g=Publicity&m=Announ&menuid=97&page=2'.$page;
            $html=$this->curl222(
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
libcurl是一个开源的网络库,可以用来进行网络数据传输和通信。通过libcurl,我们可以使用C/C++程序轻松地访问各种网络资源,例如HTTP、FTP、SMTP等协议。下面是使用libcurl进行网页数据爬取的基本流程: 1. 初始化libcurl,创建一个curl句柄。 2. 设置curl句柄的一些参数,例如需要访问的URL地址、HTTP请求方式等。 3. 设置回调函数,用于接收服务器返回的数据。 4. 执行curl_easy_perform()函数,发送HTTP请求并接收服务器返回的数据。 5. 处理接收到的数据,例如解析HTML页面并提取需要的信息。 6. 释放curl句柄和相关资源。 下面是一个简单的示例代码,演示如何使用libcurl进行网页数据爬取: ``` #include <stdio.h> #include <curl/curl.h> // 回调函数,用于接收服务器返回的数据 static size_t write_callback(char *ptr, size_t size, size_t nmemb, void *userdata) { // 将接收到的数据输出到标准输出 fwrite(ptr, size, nmemb, stdout); return size * nmemb; } int main() { CURL *curl; CURLcode res; // 初始化libcurl,创建一个curl句柄 curl = curl_easy_init(); if (curl) { // 设置curl句柄的一些参数 curl_easy_setopt(curl, CURLOPT_URL, "http://example.com/"); curl_easy_setopt(curl, CURLOPT_FOLLOWLOCATION, 1L); curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, write_callback); // 执行curl_easy_perform()函数,发送HTTP请求并接收服务器返回的数据 res = curl_easy_perform(curl); if (res != CURLE_OK) { fprintf(stderr, "curl_easy_perform() failed: %s\n", curl_easy_strerror(res)); } // 释放curl句柄和相关资源 curl_easy_cleanup(curl); } return 0; } ``` 在以上示例代码中,我们使用了curl_easy_setopt()函数来设置curl句柄的一些参数,例如需要访问的URL地址、HTTP请求方式等。我们还设置了一个回调函数,用于接收服务器返回的数据。最后,我们调用了curl_easy_perform()函数执行HTTP请求并接收服务器返回的数据
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值