libcurl远程获取文件大小源码

这是一个简单的获取远程文件大小的源码,我们可以改写为大批量异步的形式.

#include <stdio.h>
#include <curl/curl.h>

size_t get_size_struct(void* ptr, size_t size, size_t nmemb, void* data){
    return (size_t)(size * nmemb);
}

double get_download_size(char* url){
    CURL* curl;
    CURLcode res;
    double size = 0.0;

    curl = curl_easy_init();
    curl_easy_setopt(curl, CURLOPT_URL, url);
    curl_easy_setopt(curl, CURLOPT_NOBODY, 1L);
    curl_easy_setopt(curl, CURLOPT_HEADERFUNCTION, get_size_struct);
    curl_easy_setopt(curl, CURLOPT_FOLLOWLOCATION, 1L);

    res = curl_easy_perform(curl);
    res = curl_easy_getinfo(curl, CURLINFO_CONTENT_LENGTH_DOWNLOAD, &size);
    if(res != CURLE_OK){
        fprintf(stderr, "curl_easy_getinfo() failed: %s\n", curl_easy_strerror(res));
    }
    curl_easy_cleanup(curl);

    return size;
}

int main(int argc, char* argv[]){
    char url[] = "http://cdimage.ubuntu.com/releases/14.04/release/ubuntu-14.04-desktop-amd64+mac.iso";
    double filesize = get_download_size(url);
    printf("[%0.0lf] %s\n", filesize, url);
    return 0;
}

下面是批量判断代码实现的结果


分析和思考:

获取远程文件大小中遇到的问题

CURLINFO_CONTENT_LENGTH_DOWNLOAD

Pass a pointer to a double to receive the content-length of the download. This is the value read from the Content-Length: field. Since 7.19.4, this returns -1 if the size isn't known.

使用这个项获取文件大小,比较受限制,它要求必须在http Response header中带有Content-Length头域才可以。如果没有就获取不了该长度。而我们知道,如果是chunked传输的时候,就肯定没有content-length头。所以还需要寻找其他的解决方法。

测试发现,使用这种方法,对大文件(超过2M)的长度获取还是准确的,但是对html页面的小文件,因为可能是gzip或是chunk传输的,获取的长度仅只能作为参考。比如未gzip压缩和gzip压缩的传输方式获取的长度肯定不是一样的。

采用这种方法,只能限制大,不限制小,因为小文件获取不精确。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值