#8:Python爬虫的进阶之路---HTTP

HTTP请求过程

  • 请求响应模型,客户端发起请求,服务器回应请求。
  • 无状态协议。同一客户端两次请求相互独立。一次HTTP操作称为一个事务,执行过程分四步:
    1. 建立连接,如单击某个超链接
    2. 客户端发送请求,请求格式:统一资源标识符(URL)、协议版本号、MIME信息(包括请求修饰符、客户机信息和可能的内容)
    3. 服务器收到请求,给予响应信息,格式为一个状态行,包括信息协议版本号、一个成功或错误代码,MIME信息包括服务器信息,实体信息和可能的内容。
    4. 客户端接收服务器返回的信息,显示并断链
  • 状态码含义
    以上第三步客户端会收到包含http状态码的信息头(server header)用以响应浏览器请求。常见码:
    • 200——请求成功
    • 301——资源被永久转移到其他URL
    • 404——请求资源不存在
    • 500——内部服务器错误
      状态码由三个十进制组成,第一个定义了类型
      在这里插入图片描述

HTTP头部信息

由众多头域组成,每个头域由域名、冒号、域值三部分组成,域名大小写无关,域值前可加空格符
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
HTTP消息报头包括普通报头、请求报头、响应报头、实体报头
在这里插入图片描述
在这里插入图片描述

Cookie状态管理

cookie和session都是用来保护客户端状态机制,都是为了解决http无状态的问题所作的努力。前者将状态保存在客户端,后者保存在服务器端。
在这里插入图片描述

HTTP请求方式

请求方法包括:GET, POST, HEAD, PUT, DELETE, OPTIONS, TRACE, CONNECT。
常用的为GET和POST
GET: 以实体方式得到所请求的信息,即响应实体应返回最终所需要的资源
POST: 向目的服务器发出请求,并要求服务器接收附在请求后的实体,并把它当做请求队列中请求的URL资源的附加新子项。
在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值