Libcurl库——HTTP协议实现

Libcurl库简介

  1. libcurl是跨平台网络协议库,支持应用层
    http,https,ftp,gopher,tellnet,dict,file,dap协议

  2. libcurl同样支持HTTPS证书授权,HTTP POST, HTTP PUT, FTP 上传,
    HTTP基本表单上传,代理,cookies,和用户认证

库下载地址:https://github.com/curl/curl/releases/tag/curl-7_71_1

Libcurl的使用

在基于LibCurl的程序里,主要采用callback function (回调函数)的形式完成传输任务,用户在启动传输前设置好各类参数和回调函数,当满足条件时libcurl将调用用户的回调函数实现特定功能。下面是利用libcurl完成传输任务的流程:

调用curl_global_init()初始化libcurl,在调用curl_global_cleanup 函数后仍然可再用 
    初始化crul库,只能调用一次,不调用自动调用,相当于socket()
    参数:CURL_GLOBAL_ALL或CURL_GLOBAL_DEFAULT 初始化所有可能的调用
    如果这个函数在curl_easy_init函数调用时还没调用,它讲由libcurl库自动调用,所以多线程下最好主动调用该函数以防止在线程中curl_easy_init时多次调用
    虽然libcurl是线程安全的,但curl_global_init是不能保证线程安全的,所以不要在每个线程中都调用curl_global_init,应该将该函数的调用放在主线程中 应该使用:curl_global_init(CURL_GLOBAL_ALL);
void curl_global_cleanup(void);
结束libcurl使用的时候,用来对curl_global_init做的工作清理。类似于close的函数。

虽然libcurl是线程安全的,但curl_global_cleanup是不能保证线程安全的,所以不要在每个线程中都调用curl_global_init,应该将该函数的调用放在主线程中
CURL *curl_easy_init( );
curl_easy_init用来初始化一个CURL的指针(有些像返回FILE类型的指针一样)(句柄). 相应的在调用结束时要用curl_easy_cleanup函数清理.
一般curl_easy_init意味着一个会话的开始. 它会返回一个easy_handle(CURL*对象), 一般都用在easy系列的函数中.
调用 curl_easy_init()函数得到 easy interface型指针,存放的请求方式。拿到一个句柄
void curl_easy_cleanup(CURL *handle);
释放内存,完成一次请求就结束了
这个调用用来结束一个会话.与curl_easy_init配合着用. 
参数:
CURL类型的指针.
 调用curl_easy_setopt设置传输选项,去操作上面的句柄

根据curl_easy_setopt设置的传输选项,实现回调函数以完成用户特定任务。设置curl,操作,干什么
参数1:CURL指针
参数2:CURLOPT_URL 设置访问curl网站
CURLOPT_WRITEFUNCTION 返回http头输出到哪里
参数3:取决于参数2
CURLcode curl_easy_setopt(CURL *handle, CURLoption option, parameter);
这个函数最重要了.几乎所有的curl 程序都要频繁的使用它.它告诉curl库.程序将有如何的行为. 比如要查看一个网页的html代码等.(这个函数有些像ioctl函数)参数:
1:CURL类型的指针
2:各种CURLoption类型的选项.(都在curl.h库里有定义,man 也可以查看到)
3:parameter 参数 既可以是个函数的指针,也可以是某个对象的指针,也可以是个long型的变量.它用什么这取决于第二个参数.
CURLoption 这个参数的取值很多.具体的可以查看man手册.
调用curl_easy_perform()函数完成传输任务,发起请求
在初始化CURL类型的指针 以及curl_easy_setopt完成后调用. 就像字面的意思所说perform就像是个舞台.让我们设置的
option 运作起来.参数:
CURL类型的指针

在整过过程中设置curl_easy_setopt()参数是最关键的,几乎所有的libcurl程序都要使用它

curl_easy_setopt()里的部分函数

  1. CURLOPT_URL 
    

设置访问URL

  1.   CURLOPT_WRITEFUNCTION,CURLOPT_WRITEDATA
    

回调函数原型为:size_t function( void *ptr, size_t size, size_t nmemb, void *stream); 函数将在libcurl接收到数据后被调用,因此函数多做数据保存的功能,如处理下载文件。CURLOPT_WRITEDATA 用于表明CURLOPT_WRITEFUNCTION函数中的stream指针的来源。

如果你没有通过CURLOPT_WRITEFUNCTION属性给easy handle设置回调函数,libcurl会提供一个默认的回调函数,它只是简单的将接收到的数据打印到标准输出。你也可以通过 CURLOPT_WRITEDATA属性给默认回调函数传递一个已经打开的文件指针,用于将数据输出到文件里。

  1.  CURLOPT_HEADERFUNCTION,CURLOPT_HEADERDATA
    

回调函数原型为 size_t function( void *ptr, size_t size,size_t nmemb, void *stream); libcurl一旦接收到http 头部数据后将调用该函数。CURLOPT_WRITEDATA 传递指针给libcurl,该指针表明CURLOPT_HEADERFUNCTION 函数的stream指针的来源。

  1.   CURLOPT_READFUNCTION CURLOPT_READDATA
    

libCurl需要读取数据传递给远程主机时将调用CURLOPT_READFUNCTION指定的函数,函数原型是:size_t function(void *ptr, size_t size, size_t nmemb,void *stream). CURLOPT_READDATA 表明CURLOPT_READFUNCTION函数原型中的stream指针来源。

  1.   CURLOPT_NOPROGRESS,CURLOPT_PROGRESSFUNCTION,CURLOPT_PROGRESSDATA
    

跟数据传输进度相关的参数。CURLOPT_PROGRESSFUNCTION 指定的函数正常情况下每秒被libcurl调用一次,为了使CURLOPT_PROGRESSFUNCTION被调用,CURLOPT_NOPROGRESS必须被设置为false,CURLOPT_PROGRESSDATA指定的参数将作为CURLOPT_PROGRESSFUNCTION指定函数的第一个参数

  1.   CURLOPT_TIMEOUT,CURLOPT_CONNECTIONTIMEOUT:
    

CURLOPT_TIMEOUT 由于设置传输时间,CURLOPT_CONNECTIONTIMEOUT 设置连接等待时间

  1.   CURLOPT_FOLLOWLOCATION
    

设置重定位URL

测试回调函数

回调函数原型为size_t function( void ptr, size_t size,size_t nmemb, void stream)

#include <stdio.h>
#include <curl/curl.h>
#include<string.h>

#define true 1
#define false 0
typedef unsigned int bool;

size_t testreadData( void *ptr, size_t size, size_t nmemb)
{
	char Buf[1024] = {'\0'};
	strncpy(Buf,ptr,1024);
	printf("============================get data============================");
	printf("%s\n",Buf);
}

bool getUrl(char *filename)
{
    CURL *curl;
    CURLcode res;
    FILE *fp;
    if ((fp = fopen(filename, "w")) == NULL)  // 返回结果用文件存储
        return false;
    struct curl_slist *headers = NULL;
    headers = curl_slist_append(headers, "Accept: Agent-007");
    curl = curl_easy_init();    // 初始化
    if (curl)
    {
        //curl_easy_setopt(curl, CURLOPT_PROXY, "10.99.60.201:8080");// 代理
        curl_easy_setopt(curl, CURLOPT_HTTPHEADER, headers);// 改协议头
        curl_easy_setopt(curl, CURLOPT_URL,"http://www.baidu.com");
        curl_easy_setopt(curl,  CURLOPT_WRITEFUNCTION, testreadData);
 //       curl_easy_setopt(curl, CURLOPT_WRITEDATA, fp); //将返回的http头输出到fp指向的文件
//        curl_easy_setopt(curl, CURLOPT_HEADERDATA, fp); //将返回的html主体数据输出到fp指向的文件
        res = curl_easy_perform(curl);   // 执行
        if (res != 0) {

            curl_slist_free_all(headers);
            curl_easy_cleanup(curl);
        }
        fclose(fp);
        return true;
    }
}
bool postUrl(char *filename)
{
    CURL *curl;
    CURLcode res;
    FILE *fp;
    if ((fp = fopen(filename, "w")) == NULL)
        return false;
    curl = curl_easy_init();
    if (curl)
    {
        curl_easy_setopt(curl, CURLOPT_COOKIEFILE, "/tmp/cookie.txt"); // 指定cookie文件
        curl_easy_setopt(curl, CURLOPT_POSTFIELDS, "&logintype=uid&u=xieyan&psw=xxx86");    // 指定post内容
        //curl_easy_setopt(curl, CURLOPT_PROXY, "10.99.60.201:8080");
        curl_easy_setopt(curl, CURLOPT_URL, " http://mail.sina.com.cn/cgi-bin/login.cgi ");   // 指定url
        curl_easy_setopt(curl, CURLOPT_WRITEDATA, fp);
        res = curl_easy_perform(curl);
        curl_easy_cleanup(curl);
    }
    fclose(fp);
    return true;
}
int main(void)
{
    getUrl("/tmp/get.html");
    postUrl("/tmp/post.html");
}

该代码作用是访问百度主页并将读取到的数据存在数组中,可以自己更改大小

安装

下载好包之后,打开Linux,随便建一个文件夹,放进共享文件夹,然后cp /mnt/hgfs/xxx . 把文件拷贝过来,用tar xvf xxx解压
怎么去看呢,进入解压后的文件,vi README一步步看
那么怎去配置库呢:跟着走

./configure

./configure --prefix=$PWD/_install
这个是安装再当前路径,生成一个_install文件夹,默认用gcc

然后make

./configure --prefix=$PWD/_install --host=arm-linux 
这个是给arm平台安装,使用的是arm-libxxx-gcc

上一步不是必须的!!
下一步:
make install
这时就生成了_install,神奇!


这时cd进去,进入bin,但是我们不用
我们用头文件inlcude ,所以我们编译使用的时候就需要链库了,具体怎么链库,可以查看:库介绍文档.
库的名字就在cd lib里面
使用时:前面加个 #include <curl/curl.h>

编程

#include <stdio.h>
#include <curl/curl.h>

#define true 1
#define false 0
typedef unsigned int bool;
//都是为了解决c语言不知处true bool等

bool getUrl(char *filename)
{
    CURL *curl;
    CURLcode res;
    FILE *fp;
    if ((fp = fopen(filename, "w")) == NULL)  // 返回结果用文件存储
        return false;
    struct curl_slist *headers = NULL;
    headers = curl_slist_append(headers, "Accept: Agent-007");
    curl = curl_easy_init();    // 初始化
    if (curl)
    {
        //curl_easy_setopt(curl, CURLOPT_PROXY, "10.99.60.201:8080");// 代理
        curl_easy_setopt(curl, CURLOPT_HTTPHEADER, headers);// 改协议头
        curl_easy_setopt(curl, CURLOPT_URL,"http://www.baidu.com");
        curl_easy_setopt(curl, CURLOPT_WRITEDATA, fp); //将返回的http头输出到fp指向的文件
        curl_easy_setopt(curl, CURLOPT_HEADERDATA, fp); //将返回的html主体数据输出到fp指向的文件
        res = curl_easy_perform(curl);   // 执行
        if (res != 0) {

            curl_slist_free_all(headers);
            curl_easy_cleanup(curl);//释放相关句柄
        }
        fclose(fp);
        return true;
    }
}
bool postUrl(char *filename)
{
    CURL *curl;
    CURLcode res;
    FILE *fp;
    if ((fp = fopen(filename, "w")) == NULL)
        return false;
    curl = curl_easy_init();//初始化句柄
    if (curl)
    {
        curl_easy_setopt(curl, CURLOPT_COOKIEFILE, "/tmp/cookie.txt"); // 指定cookie文件
        curl_easy_setopt(curl, CURLOPT_POSTFIELDS, "&logintype=uid&u=xieyan&psw=xxx86");    // 指定post内容,需要指定相关字段
        //curl_easy_setopt(curl, CURLOPT_PROXY, "10.99.60.201:8080");
        curl_easy_setopt(curl, CURLOPT_URL, " http://mail.sina.com.cn/cgi-bin/login.cgi ");   // 指定url
        curl_easy_setopt(curl, CURLOPT_WRITEDATA, fp);
        res = curl_easy_perform(curl);
        curl_easy_cleanup(curl);
    }
    fclose(fp);
    return true;
}
int main(void)
{
    getUrl("/tmp/get.html");
    postUrl("/tmp/post.html");//俩个文件都在根目录哦
}

注意:
bool在C语言是不支持的,解决方法在代码前面

注意的小TIPS

链头文件用.I,链库用.L
我们编译,返现头文件并不认识,原因就是Linux库并没有引入,需要链头文件,链头文件是-I 不是-L哦 还需要-lcurl,但是发现还是不对!

gcc demo1.c -I ./curl-7.71.1/_install/include/ -L ./curl-7.71.1/_install/lib/ -lcurl
    c文件    指定头文件位置                     指定库位置                      动态库

因为在链库的时候,Linux会默认去/dev下面找,所以肯定找不到我们需要的库,那么怎么办呢?
所以在链库的时候还需要-L后面加上我们需要链的库的路径,然后再-lcurl
但是还有问题! 所以不得不我们需要配置一下环境变量—》
制作临时环境变量:export LD_LIBRARY_PATH=./curl-7.71.1/_install/lib/(动态库位置)
可以用export |grep LIB查看

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

llechee

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值