该文章部分内容整理自博客http://blog.sina.com.cn/s/blog_48f93b530100dt52.html
一、官网 http://curl.haxx.se/。建议上去看看,对于学习英文也很有帮助。
二、主要内容:包括命令行工具和libcurl库两个部分。命令行工具可以直接输入指令完成ftp或者http功能,libcurl则是一个客户端URL传输库,是线程安全且兼容IPv6,可以非常方便地用来做相关开发。
我们主要介绍命令行工具部分。
三、常用curl命令举例
基本语法为:curl [options] [URL...],即 curl [选项] [下载地址]。
例子1:下载百度的首页,最简单的方法启动cmd,进入curl安装目录,输入命令:curl http://www.baidu.com
例子2:-o/--output <file>
将下载的数据保存到某个文件中。如 curl -o baidu.html http://www.baidu.com则将百度首页保存到baidu.html文件中了。
如果输出的文件是一个多级目录的话,则要配合--create-dirs选项,--create-dirs将自动创建设置的输出目录。
如果希望保存到本地的文件名和服务器上的相同,就可以直接用-O选项(大写O),而省去指定本地文件名。
例子3:-c/--cookie-jar <file name> 和 -b/--cookie <name=data>
这两个选项是操作cookie的,很多服务器是需要cookie信息的。用前一个选项可以指定一个文件,将其他文件中的cookie或者从服务器得到的cookie写到文件中;
后一个选项则用来向服务器发送cookie信息,可以用"name=data"的形式,也可以直接跟一个保存cookie的文件名。
例子4:-x/--proxy <proxyhost[:port]>
该选项为http指定代理及端口,如果不指定端口,默认为1080。如 curl -x 201.36.208.19:3128 http://curl.haxx.se/。
例子5:-u/--user <user:password> 和 -U/--proxy-user <user:password>
登录某些页面或ftp需要先进行认证,输入用户名和密码。该选项可以直接处理这类操作,用指定的账号和密码进行登录认证;
后面的选项指定代理的用户名和密码,这样便可以直接用这个代理访问网页了。
如 curl -U user:password -x 201.36.208.19:3128 http://curl.haxx.se/。
例子6:-A/--user-agent <agent string>
该选项可以指定客户端类型,服务器通过该选项判断用户应用的平台及浏览器信息。如 curl -A "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)" http://www.clientinfo.com,
表示告诉服务器,客户端是运行在Windows 2000系统上的IE6.0。
例子7:-d/--data <data>
该选项用来以POST方式向http服务器发送特定数据,最常用的就是提交表单。
如 curl -d "user=username&password=111" http://www.login.com,表示用账号username和密码111向站点发送登录申请。
其中多个数据段可以用"&"进行连接一起发送;如果数据前面加上符号"@",则数据来源为后面指定的文件。
如 curl -d password=@D:\pw.txt http://www.login.com。
例子8:-C/--continue-at <offset>
该选项提供断点续传功能,与-o选项配合使用。
如 curl -C -o http://vfile.home.news.cn/music/public/vd05/200905/31/a8/MUfs052009053117155750a8be70.mp3。
如果指定offset,则从offset的位置开始续传。如果未指定offset,或者直接用"-C -",则curl会自己分析该从什么位置开始续传。
例子9:-r/--range <range>
该选项指定下载字节的范围,常应用于分块下载文件。
range的表示方式有多种,如100-500,则指定从100开始的400个字节数据;-500表示最后的500个字节;5000-表示从第5000个字节开始的所有字节;另外还可以同时指定多个字节块,中间用","分开。
如curl -r 0-1024000 -o new_divide_1.mp3 http://vfile.home.news.cn/music/public/vd05/200905/31/a8/MUfs052009053117155750a8be70.mp3 &
curl -r 1024001-2048000 -o new_divide_2.mp3 http://vfile.home.news.cn/music/public/vd05/200905/31/a8/MUfs052009053117155750a8be70.mp3 &
curl -r 2048001- -o new_divide_3.mp3 http://vfile.home.news.cn/music/public/vd05/200905/31/a8/MUfs052009053117155750a8be70.mp3
这样就会将目标mp3文件分块下载为3个文件,然后可以用dos的copy命令:copy new_divide_1.mp3/b + new_divide_2.mp3/b + new_divide_3.mp3/b new_divide.mp3即可将3个分块文件合并为一个完整的mp3文件。
例子10:--connect-timeout <seconds> 和 -m/--max-time <seconds>
该选项对于控制一个批处理操作的时长非常有用。
前者表示允许的连接的最长耗时,单位为秒;
后者表示允许的整个操作的最长耗时,单位为秒。
例子11:--max-filesize <bytes>
该选项指定所要下载的文件的最大长度,如果超过bytes值,则下载并不开始,curl返回退出码63。
例子12:--retry <num> 、 --retry-delay <seconds> 和 --retry-max-time <seconds>
该选项用于重试,默认情况下,curl 不进行重试。当传输过程中出现错误,如超时、FTP 5xx返回码或者HTTP 5xx返回码,curl会进行按照设置进行重试。
--retry <num>设置重试次数;
--retry-delay <seconds>设置两次重试的间隔时间;
--retry-max-time <seconds>设置两次重试间隔的最长时间。
如果重试,第一次间隔1秒,之后每次都间隔上一次的2倍时间,直到间隔时间达到10分钟,之后的重试都将采用10分钟间隔。如果这3个选项的值被重新设置,则执行设置值。
例子13:-T/--upload-file <file>
该选项是上传命令,如向http服务器上传一个文件:curl -T D:\new_divide.mp3 http://www.uploadserver.com/path/;
向一个ftp服务器上传文件:curl -T D:\new_divide.mp3 -u user:password ftp://upload_site:port/path/。
四、常用curl返回码
curl定义了一组"EXIT CODES",用来标识在出现错误时的相关信息,目前范围从1-83,具体信息可以查阅curl库自带的文档。这些退出码对于我们分析错误及原因有很大帮助。