curl 简介
curl是一个利用URL规则在命令行下工作的文件传输工具。它支持文件的上传和下载,所以是综合传输工具,但按传统,习惯称url为下载工具。
命令参数
-a/–append 上传文件时,附加到目标文件 -b/–cookie <name=string/file> cookie字符串或文件读取位置 -c/–cookie-jar <file> 操作结束后把cookie写入到这个文件中 -C/–continue-at <offset> 断点续转 -d/–data <data> HTTP POST方式传送数据 -D/–dump-header <file> 把header信息写入到该文件中 -G/–get 以get的方式来发送数据 -h/–help 帮助 -w/–write-out [format]输出完成后 -e/–referer 来源网址 -E/–cert <cert[:passwd]> 客户端证书文件和密码 (SSL) -f/–fail 连接失败时不显示http错误 –ftp-create-dirs 如果远程目录不存在,创建远程目录 -F/–form <name=content> 模拟http表单提交数据 -form-string <name=string> 模拟http表单提交数据 -u/–user <user[:password]>设置服务器的用户和密码 -s/–silent静音模式。不输出任何东西 -S/–show-error 显示错误 -T/–upload-file <file> 上传文件 -U/–proxy-user <user[:password]>设置代理用户名和密码 -A/–user-agent 设置用户代理发送给服务器 -i/–include 输出时包括protocol头信息 -I/–head 只显示protocol头信息 -o/–output 把输出写到该文件中 -O/–remote-name 把输出写到该文件中,保留远程文件的文件名 -p/–proxytunnel 使用HTTP代理 -m/–max-time <seconds> 设置最大传输时间 -N/–no-buffer 禁用缓冲输出 -l/–list-only 列出ftp目录下的文件名称 -R/–remote-time 在本地生成文件时,保留远程文件时间 -v/–verbose -V/–version 显示版本信息 |
- anyauth 可以使用“任何”身份验证方法 - basic 使用HTTP基本验证 -B/–use-ascii 使用ASCII /文本传输 –data-ascii <data> 以ascii的方式post数据 –data-binary <data> 以二进制的方式post数据 –negotiate 使用HTTP身份验证 –digest 使用数字身份验证 –disable-eprt 禁止使用EPRT或LPRT –disable-epsv 禁止使用EPSV –egd-file <file> 为随机数据(SSL)设置EGD socket路径 –tcp-nodelay 使用TCP_NODELAY选项 –cert-type <type> 证书文件类型 (DER/PEM/ENG) (SSL) –key <key> 私钥文件名 (SSL) –key-type <type> 私钥文件类型 (DER/PEM/ENG) (SSL) –pass <pass> 私钥密码 (SSL) –engine <eng> 加密引擎使用 (SSL). “–engine list” for list –cacert <file> CA证书 (SSL) –capath <directory> CA目录 (made using c_rehash) to verify peer against (SSL) –ciphers <list> SSL密码 –compressed 要求返回是压缩的形势 (using deflate or gzip) –connect-timeout <seconds> 设置最大请求时间 –create-dirs 建立本地目录的目录层次结构 –crlf 上传是把LF转变成CRLF –ftp-method [multicwd/nocwd/singlecwd] 控制CWD的使用 –ftp-pasv 使用 PASV/EPSV 代替端口 –ftp-skip-pasv-ip 使用PASV的时候,忽略该IP地址 –ftp-ssl 尝试用 SSL/TLS 来进行ftp数据传输 –ftp-ssl-reqd 要求用 SSL/TLS 来进行ftp数据传输 -g/–globoff 禁用网址序列和范围使用{}和[] -H/–header <line>自定义头信息传递给服务器 –ignore-content-length 忽略的HTTP头信息的长度 从文件中读取-j/–junk-session-cookies忽略会话Cookie - 界面 <interface>指定网络接口/地址使用 - krb4 <级别>启用与指定的安全级别krb4 -j/–junk-session-cookies 读取文件进忽略session cookie –interface <interface> 使用指定网络接口/地址 –krb4 <level> 使用指定安全级别的krb4 -k/–insecure 允许不使用证书到SSL站点 -K/–config 指定的配置文件读取 –limit-rate <rate> 设置传输速度 –local-port <NUM> 强制使用本地端口号 –max-redirs <num> 设置最大读取的目录数 –max-filesize <bytes> 设置最大下载的文件总量 -M/–manual 显示全手动 -n/–netrc 从netrc文件中读取用户名和密码 –netrc-optional 使用 .netrc 或者 URL来覆盖-n –ntlm 使用 HTTP NTLM 身份验证 –proxy-anyauth 选择任一代理身份验证方法 –proxy-basic 在代理上使用基本身份验证 –proxy-digest 在代理上使用数字身份验证 –proxy-ntlm 在代理上使用ntlm身份验证 -P/–ftp-port <address> 使用端口地址,而不是使用PASV -Q/–quote <cmd>文件传输前,发送命令到服务器 -r/–range <range>检索来自HTTP/1.1或FTP服务器字节范围 –range-file 读取(SSL)的随机文件 –retry <num> 传输出现问题时,重试的次数 –retry-delay <seconds> 传输出现问题时,设置重试间隔时间 –retry-max-time <seconds> 传输出现问题时,设置最大重试时间 –socks4 <host[:port]> 用socks4代理给定主机和端口 –socks5 <host[:port]> 用socks5代理给定主机和端口 –stderr <file> -t/–telnet-option <OPT=val> Telnet选项设置 –trace <file> 对指定文件进行debug –trace-ascii <file> Like –跟踪但没有hex输出 –trace-time 跟踪/详细输出时,添加时间戳 –url <URL> Spet URL to work with -x/–proxy <host[:port]>在给定的端口上使用HTTP代理 -X/–request <command>指定什么命令 -y/–speed-time 放弃限速所要的时间。默认为30 -Y/–speed-limit 停止传输速度的限制,速度时间’秒 -z/–time-cond 传送时间设置 -0/–http1.0 使用HTTP 1.0 -1/–tlsv1 使用TLSv1(SSL) -2/–sslv2 使用SSLv2的(SSL) -3/–sslv3 使用的SSLv3(SSL) –3p-quote like -Q for the source URL for 3rd party transfer –3p-url 使用url,进行第三方传送 –3p-user 使用用户名和密码,进行第三方传送 -4/–ipv4 使用IP4 -6/–ipv6 使用IP6 -#/–progress-bar 用进度条显示当前的传送状态 |
常用示例
1.抓取页面内容到一个文件中 curl -o home.html http://blog.csdn.net/chen8238065 正则匹配下载 curl -o #2_#1.jpg http://blog.csdn.net/chen8238065/~{zzh,nick}/[001-201].JPG 下载后: 001-nick.JPG |
2.用-O,后面的url要具体到某个文件,不然抓不下来 curl -O http://blog.csdn.net/chen8238065/dd.jpg |
3.模拟表单信息,模拟登录,保存cookie信息 curl -c ./cookie_c.txt -F log=aaaa -F pwd=****** http://blog.csdn.net/chen8238065 |
4.模拟表单信息,模拟登录,保存头信息 curl -D ./cookie_D.txt -F log=aaaa -F pwd=****** http://blog.csdn.net/chen8238065 -c(小写)产生的cookie和-D里面的cookie是不一样的。 |
5.使用cookie curl -b ./cookie_c.txt http://blog.csdn.net/chen8238065 curl http://blog.csdn.net/chen8238065 –cookie “user=root;pass=123456” 多个用;分开 |
6.断点续传,-C(大写的) curl -C -O |
7.传送数据,最好用登录页面测试,因为你传值过去后,curl回抓数据,你可以看到你传值有没有成功 curl -d log=aaaa http://blog.csdn.net/chen8238065 |
8.显示抓取错误,下面这个例子,很清楚的表明了。 curl -f http://blog.csdn.net/chen8238065 |
9.伪造来源地址,有的网站会判断,请求来源地址。 curl -e http://blog.csdn.net/chen8238065 http://blog.csdn.net/chen8238065 |
10.当我们经常用curl去搞人家东西的时候,人家会把你的IP给屏蔽掉的,这个时候,我们可以用代理 curl -x 24.10.28.84:32779 -o home.html http://blog.csdn.net/chen8238065 |
11.比较大的东西,我们可以分段下载 curl -r 0-100 -o img.part1 http://blog.csdn.net/chen8238065 ls |grep part | xargs du -sh 用的时候,把他们cat一下就OK了,cat img.part* >img.jpg |
12.不会显示下载进度信息 curl -s -o aaa.jpg |
13.显示下载进度条 curl -# -O |
14.通过ftp下载文件 curl -u 用户名:密码 -O http://blog.csdn.net/chen8238065 或者用下面的方式 curl -O ftp://用户名:密码@ip:port/demo/curtain/bbstudy_files/style.css |
15.通过ftp上传 curl -T test.sql ftp://用户名:密码@ip:port/demo/curtain/bbstudy_files/ |
16.使用–limit-rate限制curl的下载速度 curl URL –limit-rate 50k 命令中用k(千字节)和m(兆字节)指定下载速度限制。 |
17.使用–max-filesize指定可下载的最大文件大小 curl URL –max-filesize bytes 如果文件大小超出限制,命令则返回一个非0退出码,如果命令正常则返回0。 |
18.使用curl选项 -u 可以完成HTTP或者FTP的认证,可以指定密码,也可以不指定密码在后续操作中输入密码 curl -u user:pwd http://blog.csdn.net/chen8238065 curl -u user http://blog.csdn.net/chen8238065 |
19.通过-I或者-head可以只打印出HTTP头部 curl -I http://blog.csdn.net/chen8238065 |
20.有些网站访问会提示只能使用IE浏览器来访问,这是因为这些网站设置了检查用户代理,可以使用curl把用户代理设置为IE,这样就可以访问了。使用–user-agent或者-A选项 curl URL –user-agent “Mozilla/5.0” curl URL -A “Mozilla/5.0” |
21.其他HTTP头部信息也可以使用curl来发送,使用-H”头部信息” 传递多个头部信息 curl -H “Host:man.linuxde.net” -H “accept-language:zh-cn” URL 以json 格式请求 curl -H “Content-Type: application/json” -X POST –data ‘{“data”:”1”}’ http://127.0.0.1/ |
22.一个服务器端常用的限制方法,就是检查http访问的referer。比如你先访问首页,再访问里面所指定的下载页,这第二次访问的 referer地址就是第一次访问成功后的页面地址。这样,服务器端只要发现对下载页面某次访问的referer地址不是首页的地址,就可以断定那是个盗 连了 ~ curl给我们提供了设定referer的option: -e curl -A “Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)” -x 123.45.67.89:1080 -e “mail.linuxidc.com” -o page.html -D cookie0001.txt http://www.linuxidc.com |
22.输出完成后自定义打印信息 curl -w ‘{ “time_namelookup”: %{time_namelookup}, “time_connect”: %{time_connect}, “time_appconnect”: %{time_appconnect}, “time_pretransfer”: %{time_pretranfer}, “time_redirect”: %{time_redirect}, “time_starttransfer”: %{time_starttransfer}, “time_total”: %{time_total}, “speed_download”: %{speed_download}, “speed_upload”: %{speed_upload}, “remote_ip”: “%{remote_ip}”, “remote_port”: “%{remote_port}”, “local_ip”: “%{local_ip}”, “local_port”: “%{local_port}” }’ -D /tmp/tmpOUQ_P_ -o /tmp/tmpAUjoDh -s -S ‘http://blog.csdn.net/chen8238065/search/universal/v2?m=s&query=is_list=1%26info_type=1%26info_source=1%26size=20’ |