最近粉丝问我,访问某网站老是提示访问不存在,如下页面:
这是咋回事呢?看不懂这个提示是啥意思,有时候还会遇到其他的数字提示。今天就给大家讲讲这些数字是怎么回事,为什么我们经常会碰到。
404是响应状态码,什么叫响应状态码呢?它是表示服务器(也就是我们访问的网站)的响应状态,比如我们经常会遇到的数字200代表服务器正常响应、301代表页面永久移动、404代表服务器找不到请求的网页等等。在爬虫中我们可以根据响应状态码判断服务器的响应状态,如状态码是200,证明成功返回数据,可以做进一步处理。
我也给大家整理出了常见的错误状态码和错误原因,以后我们遇到了这些数字就可以对号入座,知道是什么原因,如下表:
状态码 | 说明 |
---|---|
100 | 继续 (请求者应该继续提出请求。服务器已接收到请求的一部分,正在等待其余部分) |
101 | 切换协议 (请求者已要求服务器切换协议,服务器已确认并准备切换) |
200 | 成功 (服务器已成功处理了请求) |
201 | 已创建 (请求成功并且服务器创建了新的资源) |
202 | 已接收 (服务器已接收请求,但尚未处理) |
203 | 非授权信息 (服务器已成功处理了请求,但返回的信息可能来自另一个源) |
204 | 无内容 (服务器成功处理了请求,但没有返回任何内容) |
205 | 重置内容 (服务器成功处理了请求,内容被重置) |
206 | 部分内容 (服务器成功处理了部分请求) |
300 | 多种选择 (针对请求,服务器可执行多种操作) |
301 | 永久移动 (请求的网页已永久移动到新位置,即永久重定向) |
302 | 临时移动 (请求的网页暂时跳转到其他页面,即暂时重定向) |
303 | 查看其他位置 (如果原来的请求是POST,重定向目标文档应该通过GET提取) |
304 | 未修改 (此次请求返回的页面未经修改,继续使用上次的资源) |
305 | 使用代理 (请求者应该使用代理访问该网页) |
307 | 临时重定向 (临时从其他位置响应请求的资源) |
400 | 错误请求 (服务器无法解析该请求) |
401 | 未授权 (请求没有进行身份验证或验证未通过) |
403 | 禁止访问 (服务器拒绝此请求) |
404 | 未找到 (服务器找不到请求的网页) |
405 | 方法禁用 (服务器禁用了请求中指定的方法) |
406 | 不接收 (无法使用请求的内容响应请求的网页) |
407 | 需要代理授权 (请求者需要使用代理授权) |
408 | 请求超时 (服务器请求超时) |
409 | 冲突 (服务器在完成请求时发生冲突) |
410 | 已删除 (请求的资源已永久删除) |
411 | 需要有效长度 (服务器不接收不含有有效内容长度标头字段的请求) |
412 | 未满足前提条件 (服务器未满足请求者在请求中设置的某一个前提条件) |
413 | 请求实体过大 (请求实体过大,超出服务器的处理能力) |
414 | 请求URL过长 (请求网址过长,服务器无法处理) |
415 | 不支持类型 (请求格式不被请求页面支持) |
416 | 请求范围不符 (页面无法提供请求的范围) |
417 | 未满足期望值 (服务器未满足期望请求标头字段的要求) |
500 | 服务器内部错误 (服务器遇到错误,无法完成请求) |
501 | 未实现 (服务器不具备完成请求的能力) |
502 | 错误网关 (服务器作为网关或代理,接收到上游服务器的无效响应) |
503 | 服务不可用 (服务器目前无法使用) |
504 | 网关超时 (服务器作为网关或代理,没有及时从上游服务器接收到请求) |
505 | HTTP版本不支持 (服务器不支持请求中使用的HTTP协议版本) |