curl是一款著名的字符界面下的下载工具,支持HTTP、HTTPS、FTP、FTPS、DICT、TELNET、LDAP、FILE,和GOPHER。此外还具有cookies支持、断点续传、FTP上传、密码支持、SSL支持和代理支持等特性。curl同时还提供了一套libcurl的库,开发者可以基于这个库开发其他下载工具。
官网下载地址:http://curl.haxx.se/download/
我找到最后的:curl-7.64.0.tar.gz (最新版吧)
功能我就简单说下抓取网页信息、模拟发送请求、模拟cookies等等
1、将文件拉进虚拟机系统里。
2.解压
解压命令:tar -xzvf curl-7.64.0.tar.gz
3.安装
命令转入刚解压的包: curl-7.64.0
输入:./configure (等待加载)
输入: make (预加载)
(在解压包里 curl-7.64.0)再输入: make install (需要管理员权限: sudo make install 或 你可以超级root用户进行: make install )
完成。。。。。
注意注意有个地方需要改
我试着输入命令:curl www.baidu.com
会报错:curl: error while loading shared libraries: libcurl.so.4: cannot open shared
这时我们需要改
在/etc/ld.so.conf中加入libcurl.so所在的目录路径(一般在/usr/local/lib/)
用root权限指令打开文件进行修改: mousepad ld.so.conf 如果没mousepad 可以用debian自带的编辑器 : vi ld.so.conf
保存退出
再输入命令:/sbin/ldconfig -v
才生效
真的完成。。。哈哈哈
------------------------------------------------------------------常见使用----------------------------------------------------------
之前我就是安装简单的测试就不理了,某个网友问了下我,我才发现curl还有其他的用法 --.-- ,费话不多说了
这是我上网搜的(毕竟本人不是做大数据的,哈哈)
1、获取页面内容(不加任何选项,默认会发送 GET 请求来获取链接内容到标准输出。 )
curl www.baidu.com
2、如果我们只想要显示 HTTP 头 (注意:大写的i )
curl -I www.baidu.com
也可以同时显示 HTTP 头和文件内容,使用 -i 选项
3、将链接保存到文件(A是文件路径 如 /home/aaa.html (如果没有文件aaa.html默认创建aaa.html))
curl www.baidu.com > A
或
curl 自带的选项 -o 或 -O
小写o:curl -o A www.baidu.com
大写O:curl -O http://fanyi.bdstatic.com/static/translation/img/header/logo_40c4f13.svg (这个需要指定文件如logo_40c4f13.svg 这个文件好像保存在当前路径)
4. 同时下载多个文件
我们可以使用 -o 或 -O 选项来同时指定多个链接,按照以下格式编写命令:
curl -O http://www.codebelief.com/page/2/ -O http://www.codebelief.com/page/3/
或者:
curl -o A http://www.codebelief.com/page/1/ -o A2 http://www.codebelief.com/page/2/
5、使用 -L 跟随链接重定向
如果直接使用 curl 打开某些被重定向后的链接,这种情况下就无法获取我们想要的网页内容。例如:
curl http://codebelief.com
而当我们通过浏览器打开该链接时,会自动跳转到 http://www.codebelief.com。此时我们想要 curl 做的,就是像浏览器一样跟随链接的跳转,获取最终的网页内容。我们可以在命令中添加 -L 选项来跟随链接重定向:
curl -L http://codebelief.com
6. 使用 -A 自定义 User-Agent (这个自己搜下,下面的案例有问题)
我们可以使用 -A 来自定义用户代理,例如下面的命令将伪装成安卓火狐浏览器对网页进行请求:
curl -A “Mozilla/5.0 (Android; Mobile; rv:35.0) Gecko/35.0 Firefox/35.0” http://www.baidu.com
下面我们会使用 -H 来实现同样的目的。
当我们需要传递特定的 header 的时候,可以仿照以下命令来写:
curl -H “Referer: www.example.com” -H “User-Agent: Custom-User-Agent” http://www.baidu.com
可以看到,当我们使用 -H 来自定义 User-Agent 时,需要使用 “User-Agent: xxx” 的格式。
我们能够直接在 header 中传递 Cookie,格式与上面的例子一样:
curl -H “Cookie: JSESSIONID=D0112A5063D938586B659EF8F939BE24” http://www.example.com
另一种方式会在下面介绍。
当我们使用 cURL 访问页面的时候,默认是不会保存 Cookie 的。有些情况下我们希望保存 Cookie 以便下次访问时使用。例如登陆了某个网站,我们希望再次访问该网站时保持登陆的状态,这时就可以现将登陆时的 Cookie 保存起来,下次访问时再读取。
-c 后面跟上要保存的文件名。
curl -c “cookie-example” http://www.example.com
前面讲到了使用 -H 来发送 Cookie 的方法,这种方式是直接将 Cookie 字符串写在命令中。如果使用 -b 来自定义 Cookie,命令如下:
curl -b “JSESSIONID=D0112A5063D938586B659EF8F939BE24” http://www.example.com
如果要从文件中读取 Cookie,-H 就无能为力了,此时可以使用 -b 来达到这一目的:
curl -b “cookie-example” http://www.example.com
即 -b 后面既可以是 Cookie 字符串,也可以是保存了 Cookie 的文件名。
我们以登陆网页为例来进行说明使用 cURL 发送 POST 请求的方法。假设有一个登录页面 www.example.com/login,只需要提交用户名和密码便可登录。我们可以使用 cURL 来完成这一 POST 请求,-d 用于指定发送的数据,-X 用于指定发送数据的方式:
curl -d “userName=tom&passwd=123456” -X POST http://www.example.com/login
在使用 -d 的情况下,如果省略 -X,则默认为 POST 方式:
curl -d “userName=tom&passwd=123456” http://www.example.com/login
强制使用 GET 方式
发送数据时,不仅可以使用 POST 方式,也可以使用 GET 方式,例如:
curl -d “somedata” -X GET http://www.example.com/api
或者使用 -G 选项:
curl -d “somedata” -G http://www.example.com/api
从文件中读取 data
curl -d “@data.txt” http://www.example.com/login
带 Cookie 登录
当然,如果我们再次访问该网站,仍然会变成未登录的状态。我们可以用之前提到的方法保存 Cookie,在每次访问网站时都带上该 Cookie 以保持登录状态。
curl -c “cookie-login” -d “userName=tom&passwd=123456” http://www.example.com/login
再次访问该网站时,使用以下命令:
curl -b “cookie-login” http://www.example.com/login
这样,就能保持访问的是登录后的页面了。
- curl -v https://www.baidu.com(curl -v / --verbose:获取更多的详细信息)
- curl --trace dump https://www.baidu.com(
--trace [filename]
将在给定的文件名中保存完整的跟踪,每个发送和接收的字节都以十六进制数字单独显示。) - curl --trace-ascii dump https://www.baidu.com(--trace-ascii [filename]将在给定的文件名中保存完整的跟踪,但每个发送和接收的字节不以十六进制数字单独显示。)
curl -v --trace-time https://www.baidu.com
- curl -w "Type: %{content_type}\nCode: %{response_code}\n" https://www.baidu.com(https://ec.haxx.se/usingcurl-verbose.html)
- curl -w "formatted string\n" https://www.baidu.com(curl -w / --write-out:在传输完成后写出信息,并且它包含大量可以包含在输出中的变量,已经使用值和传输信息设置的变量。)