7.1-curl及wget使用说明

本文介绍了数据抓取工具curl、wget和httpie的安装方法,以及它们的常用参数,如设置user-agent、请求方法、下载文件、自定义命令等,帮助读者掌握基本的数据获取技巧。
摘要由CSDN通过智能技术生成

数据抓取工具及爬虫相关库

curl的使用

注意:安装的时候可能会遇到报错,有可能是openssl没装,

apt install curl
apt install openssl
apt install openssl-dev

一些常用参数的用法

参数说明示例
-A设置user-agentcurl -A “Chrome” http://www.baidu.com
-X用指定方法请求curl -X POST http://httpbin.org/post
-I只返回请求的头信息
-d以POST方法请求url,并发送相应的参数-d a=1 -d b=2 -d c=3
-d “a=1&b=2&c=3”
-d @filename
-O下载文件并以远程的文件名保存
-o下载文件并以指定的文件名保存curl -o fox.jpeg http://httpbin.org/image/jpeg
-L跟随重定向请求curl -IL https://baidu.com
-H设置头信息curl -o image.webp -H “accept:image/webp” http://httpbin.org/image
-k允许发起不安全的SSL请求
-b设置cookiescurl -b a=test http://httpbin.org/cookies
-s不显示其他无关信息
-v显示连接过程中的所有信息

自定义一个命令,查看本机外网IP

alias myip="curl http://httpbin.org/get|grep -E '\d+'|grep -v User-Agent|cut -d '\"' -f4"

wget

安装:

apt install wget

参数说明

ABC
-O以指定文件名保存下载的文件wget -O test.png http://httpbin.org/image/png
–limit-rate以指定的速度下载目标文件–limit-rate=200k
-c断点续传
-b后台下载
-U设置User-Agent
–mirror镜像某个目标网站
-p下载页面中的所有相关资源
-r递归下载所有网页中所有的链接
# 镜像下载整个网站并保存到本地
wget -c --mirror -U "Mozilla" -p --convert-links http://docs.python-requests.org

httpie

apt install httpie
pip install httpie
  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序员zhi路

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值