爬虫中需要关注的一些HTTP协议的知识:

'''
爬虫中需要关注的一些HTTP协议的知识:


请求:
url:统一资源定位符
请求方法:
get:请求数据,将数据拼接在url后面.
post:数据放在请求体中.
请求体:
formdata:
json:
file:
请求头:
Cookie:标记登录状态的
User-Agent:记录用户身份
referer:告诉服务器你从哪里来

响应:
Status Code:状态表示码
1XX:请求不成功
2xx:请求成功,
3xx:重定向
4xx:请求错误,例如404请求资源不存在
5xx:服务器错误
这个状态标识码,也不是唯一确定的,这个返回结果可以是开发人员自己
设置自己定义的,并不一定都遵循这个规律.
响应头:
location:重定向的地址
Set-Cookie:设置cookie
特别字段:某些网站特有的
响应体:
1.html源码
2.二进制:图片,视频
3.json

'''

转载于:https://www.cnblogs.com/1832921tongjieducn/p/11492751.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值