HTTP状态码表示HTTP协议所返回的响应的状态。比如客户端向服务器发送请求,如果成功地获得请求的资源,则返回的状态码为200,表示响应成功。如果请求的资源不存在,则通常返回404错误。
HTTP状态码通常分为5种类型,分别以1~5五个数字开头,由3位整数组成。1XX通常用作实验用途。這一节主要介绍2XX、3XX、4XX、5XX等常用的几种状态码,如下所示。
HTTP常用状态码
状态码 | 代码描述 | 处理方式 |
---|---|---|
200 | 请求成功 | 获得响应内容,进行处理 |
201 | 请求完成,结果是创建了新资源。新创建资源的URI可在响应的实体中得到 | 爬虫不会遇到 |
202 | 请求被接受,但处理尚未完成 | 阻塞等待 |
204 | 服务器端已经实现了请求,但是没有返回新的信息。如果客户端是用户代理,则无须为此更新自身的文档视图 | 丢弃 |
300 | 该状态码不被HTTP/1.0的应用程序直接使用,只是作为3XX类型回应的默认解释。存在多个可用的被请求资源 | 若程序中能够处理,则进行进一步处理,如果程序中不能处理,则丢弃 |
301 | 请求到的资源都会分配一个永久的URL,这样就可以在将来通过URL来访问此资源 | 重定向到分配的URL |
302 | 请求到的资源在一个不同的URL处临时保存 | 重定向到临时的URL |
304 | 请求的资源未更新 | 丢弃 |
400 | 非法请求 | 丢弃 |
401 | 未授权 | 丢弃 |
403 | 禁止 | 丢弃 |
404 | 没有找到 | 丢弃 |
5XX | 回应代码以”5”开头的状态码表示服务器端发现自己出现错误,不能继续执行请求 | 丢弃 |