如何抓取百度的包
1、打开审查元素,点击这个网络
2、刷新网页,抓取这个包
一、请求行
其中:
请求方法: get、post(将来慢慢补充)
二、请求标头
accept: 告诉浏览器,它所支持的数据类型
Encoding: 支持哪一种编码格式
Language:告诉浏览器,他的语言环境
Cache-Control: 缓存控制
Connection:告诉浏览器,请求完成后是断开还是连接
Host: 表示主机
三、响应头
主要的内容和请求差不多
四、请求状态码
1、200 : 表示请求响应成功
2、4** : 表示找不到资源
将来遇到最多的就是404
3、3** :表示重定向(界面会跳转到另一个网页,告诉你去别的页面找你想要的信息)
4、5** : 表示服务器代码错误(服务器崩掉)
将来遇到最多的是500
常见响应码
1开头系列:表示请求已接收,继续处理
100
2开头系列:成功--表示请求已被成功接收、理解、接受
200 ok 表示请求成功返回网页
3开头系列:表示重定向,要完成请求必须进行更进一步的操作
301 永久跳转
302 临时跳转,请求的网页已临时跳转到新位置。
4开头系列:客户端错误--请求有语法错误或请求无法实现
400 服务器不理解请求的语法。
401 请求要求身份验证。对于登录后请求的网页,服务器可能返回此响应。
403 表示用户得到授权(与401错误相对),但是访问是被禁止的,服务器收到请求但是拒绝提供服务
404 网页没有发现
406 用户请求的格式不可得(比如用户请求JSON格式,但是只有XML格式)。
5开头系列:服务器端错误--服务器未能实现合法的请求
500 内部服务器错误(比如后台代码报空指针,就是500的状态码)
502 一般是网关服务器请求后端服务时,后端服务没有按照http协议正确返回结果。
503 服务当前不可用, 可能因为超载或停机维护。
504 一般是网关服务器请求后端服务时,后端服务没有在特定的时间内完成服务。