文章目录
- 一、命令介绍
- 二、常用选项
- 三、wget 与 curl 对比
- 四、命令示例
-
- (一)以 post 方式提交数据/以 post 方式传递请求参数
- (二)查看网页的源码内容
- (三)保存访问的网页源码内容
- (四)将服务器的回应保存成文件/将输出保存成文件
- (五)显示 http response 头信息,打印出服务器回应的 HTTP 标头
- (六)显示通信过程,用于调试
- (七)只返回状态码
- (八)设置来源网址,设置请求的来源,设置标头 Referer
- (九)指定客户端的用户代理标头(客户端的设备信息)
- (十)向服务端发送 cookie
- (十一)将服务器返回的 cookie 保存到文件中
- (十二)将发送的数据进行 URL 编码
- (十三)上传文件/向服务器上传二进制文件
- (十四)以 get 的方式来发送数据
- (十五)设置 HTTP 请求标头
- (十六)仅打印出 http response 的头信息,将服务器返回的 HTTP 标头打印出来
- (十七)跳过 SSL 检测
- (十八)让 HTTP 请求跟随服务器的重定向
- (十九)限制 HTTP 请求和响应的带宽,模拟慢网速环境
- (二十)不输出错误和进度信息
- (二十一)设置服务器认证的用户名和密码
- (二十二)指定 HTTP 请求的代理/指定 proxy 服务器以及其端口
- (二十三)指定 HTTP 请求的方法
- (二十四)下载单个文件
- (二十五)下载单个文件,断点续传
- (二十六)带宽控制和下载配额
- (二十七)将响应头信息保存到文件
- (二十八)模仿浏览器
- (二十九)伪造 referer(盗链)
- (三十)循环下载
- (三十一)下载重命名
- (三十二)分块下载/分段下载
- (三十三)通过 ftp 下载文件
- (三十四)显示下载进度条
- (三十五)不会显示下载进度信息
一、命令介绍
curl
可以理解为客户端(client)的 URL 工具,也可以理解为命令行的 URL 工具,英文全称为:CommandLine Uniform Resource Locator
,中文名称:统一资源定位器命令行。
curl
命令是一个利用URL规则在命令行下工作的文件传输工具。它支持文件的上传和下载,所以是综合传输工具,但按传统,习惯称 curl
为下载工具。
curl
支持包括 HTTP、HTTPS、ftp 等众多协议,还支持 POST、cookies、认证、从指定偏移处下载部分文件、用户代理字符串、限速、文件大小、进度条等特征。做网页处理流程和数据检索自动化,curl
可以助你一臂之力。如果熟练的话,完全可以取代 Postman 这一类的图形界面工具。
curl
命令可以用来执行下载、发送各种 HTTP 请求,指定 HTTP 头部等操作。如果系统没有 curl
可以使用 yum install curl
安装,也可以下载安装。curl
默认是将下载文件输出到 stdout(标准输出),将进度信息输出到 stderr(standard error,标准错误),不显示进度信息使用 --silent
选项。
二、常用选项
选项 | 说明 |
---|---|
-a 或 --append |
上传文件时,附加到目标文件 |
-A 或 --user-agent |
设置用户代理发送给服务器,可以用来伪造浏览器类型 |
-anyauth |
可以使用任何身份验证方法 |
-b 或 --cookie |
将 cookie 字符串或者保存有 cookie 信息的文件发送给服务端 |
--basic |
使用 HTTP 基本验证 |
-B 或 --use -ascii |
使用 ASCII 或文本传输 |
-c 或 --cookie-jar |
操作结束后把 cookie 写入到指定的文件中 |
-C 或 --continue-at |
断点续传 |
-d 或 --data |
其实这个选项是用来指定参数的,只是使用了这个选项,会自动将 HTTP 请求转为 POST 方法,即以 HTTP POST 方式传送数据 |
--data-ascii |
以 ascii 的方式 post 数据 |
--data-binary |
以二进制的方式 post 数据 |
--negotiate |
使用 HTTP 身份验证 |
--digest |
使用数字身份验证 |
--disable-eprt |
禁止使用 EPRT 或 LPRT |
--disable-epsv |
禁止使用 EPSV |
-D 或 --dump-header |
把 header 信息写入到文件中 |
--egd-file |
为随机数据(SSL)设置 EGD socket 路径 |
--tcp-nodelay |
使用 TCP_NODELAY 选项 |
-e 或 --referer |
来源网址 |
-E 或 --cert |
客户端证书文件和密码 (SSL) |
--cert-type |
证书文件类型 (DER 或 PEM 或 ENG) (SSL) |
--key |
私钥文件名 (SSL) |
--key-type |
私钥文件类型 (DER 或 PEM 或 ENG) (SSL) |
--pass |
私钥密码 (SSL) |
--engine |
加密引擎使用 (SSL). “–engine list” for list |
--cacert |
CA证书 (SSL) |
--capath |
CA目录 (made using c_rehash) to verify peer against (SSL) |
--ciphers |
SSL密码 |
--compressed |
要求返回是压缩的形势 (using deflate or gzip) |
--connect-timeout |
设置最大请求时间 |
--create-dirs |
建立本地目录的目录层次结构 |
--crlf |
上传是把LF转变成CRLF |
-f 或 --fail |
连接失败时不显示http错误 |
--ftp-create-dirs |
如果远程目录不存在,创建远程目录 |
--ftp-method |
multicwd 或 nocwd 或 singlecwd,控制CWD的使用 |
--ftp-pasv |
使用 PASV 或 EPSV 代替端口 |
--ftp-skip-pasv-ip |
使用PASV的时候,忽略该IP地址 |
--ftp-ssl |
尝试用 SSL 或 TLS 来进行ftp数据传输 |
--ftp-ssl-reqd |
要求用 SSL 或 TLS 来进行ftp数据传输 |
-F 或 --form |
模拟http表单提交数据 |
--form-string |
模拟http表单提交数据 |
-g 或 --globoff |
禁用网址序列和范围使用{}和[] |
-G 或 --get |
以 get 的方式来发送数据 |
-H 或 --header |
自定义头信息传递给服务器 |
--ignore-content-length |
忽略的HTTP头信息的长度 |
-i 或 --include |
输出时包括 protocol 头信息,http response 头信息 |
-I 或 --head |
只显示 http response 的头信息。 |
-j 或 --junk-session-cookies |
读取文件进忽略session cookie |
--interface |
使用指定网络接口 或 地址 |
--krb4 |
使用指定安全级别的krb4 |
-k 或 --insecure |
允许不使用证书到SSL站点 |
-K 或 --config |
指定的配置文件读取 |
-l 或 --list-only |
列出ftp目录下的文件名称 |
--limit-rate |
设置传输速度 |
--local-port |
强制使用本地端口号 |
-m 或 --max-time |
设置最大传输时间 |
--max-redirs |
设置最大读取的目录数 |
--max-filesize |
设置最大下载的文件总量 |
-M 或 --manual |
显示全手动 |
-n 或 --netrc |
从netrc文件中读取用户名和密码 |
--netrc-optional |
使用 .netrc 或者 URL来覆盖-n |
--ntlm |
使用 HTTP NTLM 身份验证 |
-N 或 --no-buffer |
禁用缓冲输出 |
-o 或 --output |
把输出写到该文件中 |
-O 或 --remote-name |
把输出保存成文件,保留远程文件的文件名。 或者说将服务器回应保存成文件,并将 URL 的最后部分当作文件名。要注意后面的 URL 要具体到某个文件,不然抓不下来 |
-p 或 --proxytunnel |
使用HTTP代理 |
--proxy-anyauth |
选择任一代理身份验证方法 |
--proxy-basic |
在代理上使用基本身份验证 |
--proxy-digest |
在代理上使用数字身份验证 |
--proxy-ntlm |
在代理上使用ntlm身份验证 |
-P 或 --ftp-port |
使用端口地址,而不是使用PASV |
-q |
作为第一个参数,关闭 .curlrc |
-Q 或 --quote |
文件传输前,发送命令到服务器 |
-r 或 --range |
检索来自HTTP 或 1.1或FTP服务器字节范围 |
--range-file |
读取(SSL)的随机文件 |
-R 或 --remote-time |
在本地生成文件时,保留远程文件时间 |
--retry |
传输出现问题时,重试的次数 |
--retry-delay |
传输出现问题时,设置重试间隔时间 |
--retry-max-time |
传输出现问题时,设置最大重试时间 |
-s 或 --silent |
静默模式。不输出任何东西 |
-S 或 --show-error |
显示错误 |
--socks4 |
用socks4代理给定主机和端口 |
--socks5 |
用socks5代理给定主机和端口 |
--stderr |
重定向stderr的位置(stdout使用“-”) |
-t 或 --telnet-option |
Telnet选项设置 |
--trace |
对指定文件进行debug |
--trace-ascii |
Like --跟踪但没有hex输出 |
--trace-time |
跟踪 或 详细输出时,添加时间戳 |
-T 或 --upload-file |
上传文件 |
--url |
Spet URL to work with |
-u 或 --user |
设置服务器的用户和密码 |
-U 或 --proxy-user |
设置代理用户名和密码 |
-w 或 --write-out [format] |
什么输出完成后 |
-x 或 --proxy |
在给定的端口上使用HTTP代理 |
-X 或 --request |
指定什么命令 |
-y 或 --speed-time |
放弃限速所要的时间,默认为30 |
-Y 或 --speed-limit |
停止传输速度的限制,速度时间 |
--data-urlencode |
如果提交的表单数据未编码,可以使用此选项 |
三、wget 与 curl 对比
wget
是一个独立的下载程序,无需额外的资源库,它也允许你下载网页中或是 FTP 目录中的任何内容, 能享受它超凡的下载速度,简单直接。curl
是一个多功能工具,是libcurl
这个库支持的。它可以下载网络内容,但同时它也能做更多别的事情。- 从用途方面,
wget
倾向于网络文件下载;curl
倾向于网络接口调试,相当于一个无图形界面的 PostMan 工具。
四、命令示例
(一)以 post 方式提交数据/以 post 方式传递请求参数
curl -X POST -d <DATA> http://www.example.com/test
-d <DATA>
:指定 POST 请求体。DATA
形式(参数形式)可以是 “k1=v1&k2=v2”, 也可以是 json 串--data-urlencode <DATA>
:与-d
相同,区别在于会自动将发送的数据进行 URL 编码- 使用
-d
参数以后,HTTP 请求会自动加上标头Content-Type : application/x-www-form-urlencoded
。并且会自动将请求转为 POST 方法,因此可以省略-X POST
。如果要发送的请求体为json
串,需要指定Content-Type:application/json
。
以 post 方式提交 json 格式的参数,访问登录接口:
[root@htlwk0001host ~]# curl -d '{"user":"zhangsan", "password":"123456"}' -H 'Content-Type:application/json' http://www.example.com/login
调用接口 https://www.bb.com/bb/api/hy /list
,以 json 格式传参 is_recommand=1
,查询推荐的行业分类:
[root@htlwk0001host ~]# curl -d {"is_recommand":"1"} -H 'Content-Type:application/json' https://www.bb.com/bb/api/hy /list
以 post 方式提交非 json 格式的参数,访问登录接口:
[root@htlwk0001host ~]# curl -d 'login=emma&password=123' -X POST https://google.com/login
[root@htlwk0001host ~]# curl -d 'login=emma' -d 'password=123' -X POST https://google.com/login
参数较多时,可以把参数保存到本地文本中,然后从文本中读取参数数据,-d
参数可以读取本地文本文件的数据,向服务器发送,例如:
curl -d '@requestData.txt' -H 'Content-Type:application/json' http://www.example.com/login
(二)查看网页的源码内容
[root@htlwk0001host ~]# curl www.baidu.com
<!DOCTYPE html>
<!--STATUS OK--><html> <head><meta http-equiv=content-type content=text/html;charset=utf-