1、Curl简介
libcurl作为是一个多协议的便于客户端使用的URL传输库,基于C语言,提供C语言的API接口,支持DICT, FILE, FTP, FTPS, Gopher, HTTP, HTTPS, IMAP, IMAPS, LDAP, LDAPS, POP3, POP3S, RTMP, RTSP, SCP, SFTP, SMTP, SMTPS, Telnet and TFTP这些协议,同时支持使用SSL证书的安全文件传输:HTTP POST, HTTP PUT, FTP 上传, 基于HTTP形式的上传、代理、Cookies、用户加密码的认证等多种应用场景。另外,libcurl是一个高移植性的库,能在绝大多数系统上运行,包括Solaris, NetBSD, FreeBSD, OpenBSD, Darwin, HPUX, IRIX, AIX, Tru64, Linux, UnixWare, HURD, Windows, Amiga, OS/2, BeOs, Mac OS X, Ultrix, QNX, OpenVMS, RISC OS, Novell NetWare, DOS等。
libcurl提供了两种接口,分别是easy interface和multi interface。easy interface以同步的方式进行数据传输,执行curl函数时会一直阻塞到数据传输完毕后返回,且一次操作只能发送一次请求,如果要同时发送多个请求,必须使用多线程。 而multi interface以一种简单的、非阻塞、异步的方式进行传输,它允许在一个线程中,同时提交多个相同类型的请求。 在使用multi interface之前,你应该掌握easy interface的基本使用。因为multi interface是建立在easy interface基础之上的,它只是简单的将多个easy handler添加到一个multi stack,而后同时传输而已。
2、Easy interface
在基于libcurl的程序里,主要采用callback function (回调函数)的形式完成传输任务,用户在启动传输前设置好各类参数和回调函数,当满足条件时libcurl将调用用户的回调函数实现特定功能。下面是利用libcurl完成传输任务的流程:
- 调用 curl_global_init() 初始化 libcurl;
- 调用 curl_easy_init() 函数得到 easy interface型指针;
- 调用 curl_easy_setopt() 设置传输选项,根据 curl_easy_setopt() 设置的传输选项,实现回调函数以完成用户特定任务;
- 调用 curl_easy_perform() 函数完成传输任务;
- 调用 curl_easy_cleanup() 释放内存。
在整过过程中设置 curl_easy_setopt() 参数是最关键的,几乎所有的libcurl程序都要使用它。
(1)CURLcode curl_global_init(long flags)
描述:这个函数只能用一次。(其实在调用curl_global_cleanup() 函数后仍然可再用),如果这个函数在curl_easy_init函数调用时还没调用,它讲由libcurl库自动完成。
参数:flags
- CURL_GLOBAL_ALL //初始化所有的可能的调用。
- CURL_GLOBAL_SSL //初始化支持 安全套接字层。
- CURL_GLOBAL_WIN32 //初始化win32套接字库。
- CURL_GLOBAL_NOTHING //没有额外的初始化。
(2)void curl_global_cleanup(void)
描述:在结束libcurl使用的时候,用来对curl_global_init做的工作清理。类似于close的函数。
(3)char *curl_version( )
描述: 打印当前libcurl库的版本。
(4)CURL *curl_easy_init( )
描述:curl_easy_init用来初始化一个CURL的指针(有些像返回FILE类型的指针一样). 相应的在调用结束时要用curl_easy_cleanup 函数清理。一般curl_easy_init意味着一个会话的开始. 它的返回值一般都用在easy系列的函数中.
(5)void curl_easy_cleanup(CURL *handle)
描述:这个调用用来结束一个会话.与curl_easy_init配合着用.
参数: CURL类型的指针.
(6)CURLcode curl_easy_perform(CURL *handle)
描述:这个函数在初始化CURL类型的指针 以及curl_easy_setopt完成后调用. 就像字面的意思所说perform就像是个舞台.让我们设置的option 运作起来。
参数: CURL类型的指针.。
返回值:返回0意味一切ok,非0代表错误发生。主要错误码说明:
- CURLE_OK : 任务完成一切都好;
- CURLE_UNSUPPORTED_PROTOCOL:不支持的协议,由URL的头部指定;
- CURLE_COULDNT_CONNECT:不能连接到remote 主机或者代理;
- CURLE_REMOTE_ACCESS_DENIED:访问被拒绝;
- CURLE_HTTP_RETURNED_ERROR:Http返回错误;
- CURLE_READ_ERROR:读本地文件错误;
(7)CURLcode curl_easy_getinfo(CURL *curl, CURLINFO info, ... )
描述:发出http请求后,服务器会返回应答头信息和应答数据,如果仅仅是打印应答头的所有内容,则直接可以通过curl_easy_setopt(curl, CURLOPT_HEADERFUNCTION, function) 的方式来完成,这里需要获取的是应答头中特定的信息,比如应答码、cookies列表等需要通过这个函数。注意,这个函数必须在执行 curl_easy_perform() 后调用。
参数:
info参数就是我们需要获取的内容,下面是一些参数值:
- CURLINFO_RESPONSE_CODE:获取应答码;
- CURLINFO_HEADER_SIZE:头大小;
- CURLINFO_COOKIELIST: cookies列表。
第三个参数必须是指向 long的指针、指向char *的指针、指向struct curl_slist *的指针或指向double的指针,函数调用返回CURL_OK时,指向的数据将被填充。
(8)CURLcode curl_easy_setopt(CURL *handle, CURLoption option, parameter)
描述: 这个函数最重要了,几乎所有的curl 程序都要频繁的使用它.它告诉curl库.程序将有如何的行为.。比如要查看一个网页的html代码等.(这个函数有些像ioctl函数)
参数:
CURL类型的指针;
各种CURLoption类型的选项.(都在curl.h库里有定义),下面我们对这个选项进行详细解读;
parameter 这个参数既可以是个函数的指针,也可以是某个对象的指针,也可以是个long型的变量.它用什么这取决于第二个参数。
CURLoption的各种参数介绍: