python爬虫01

数据抓取使用:
Library: requests urlib pycurl
tools: curl wget httpie

curl使用
shell
curl http://www.baidu.com

-A 设置user-agent
curl -A ‘Chrome’ https://www.baidu.com

-X 设置请求方式
curl -X POST http://httpbin.org/post

-I只返回请求的头信息
curl -I http://httpbin.org/get

-d以POST请求方式请求URL,并发送相应的参数
curl -d test=123 http://httpbin.org/post
curl -d “a=1&b=2&c=3” http://httpbin.org/post
curl -d a=1 -d b=2 http://httpbin.org/post
curl -d @filename http://httpbin.org/post

-O 下载文件并以远程的文件名保存到本地
curl -O http://httpbin.org/image/jpeg
-o 重命名
curl -o fox.jpeg http://httpbin.org/image/jpeg

-L跟随重定向请求
curl -L https://baidu.com

-H设置头信息
curl -o image.webp -H “accept:image/webp” http://httpbin.org/image
curl -o image.png -H “accept:image/png” http://httpbin.org/image

-k允许发起不安全请求

-b 设置cookies
curl -b a=test http://httpbin.org/cookies

-s不显示其他无关信息
curl --help查看更多参数

man curl更详细 q退出

curl http://httpbin.org/get|grep -E “\d+” |grep -v User-Agent
-E表示正则匹配 d数字 -v不包含

wget专注于下载

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值