http或超文本传输协议适用于客户端服务器模型。通常,Web浏览器是客户端,托管网站的计算机是服务器。在收到客户端的请求后,服务器会生成响应并将其以某种格式发送回客户端。
在接收并解释了请求消息后,服务器将以HTTP响应消息进行响应:
状态行
零个或多个标头(General | Response | Entity)字段,后跟CRLF
空行(即CRLF之前没有任何内容的行)指示标题字段的末尾
可选的消息正文
以下各节说明了HTTP响应消息中使用的每个实体。
1. 消息状态行
状态行由协议版本,后面的数字状态代码及其关联的文本短语组成。元素由空格SP字符分隔。
Status-Line = HTTP-Version SP Status-Code SP Reason-Phrase CRLF
2. HTTP版本
支持HTTP版本1.1的服务器将返回以下版本信息:
HTTP-Version = HTTP/1.1
3. 状态码
Status-Code元素是一个三位数的整数,其中Status-Code的第一位定义响应的类别,最后两位不具有任何分类作用。第一位数字有5个值:
编号
状态码
描述
1
1xx
信息性:表示已收到请求,并且该过程正在继续。
2
2xx
成功:表示已成功接收,理解并接受了该动作。
3
3xx
重定向:表示必须采取进一步的措施才能完成请求。
4
4xx
客户端错误:请求包含不正确的语法或无法实现。
5
5xx
服务器端错误:服务器无法满足有效的请求。
HTTP状态代码是可扩展的,不需要HTTP应用程序来了解所有已注册状态代码的含义。
4. 使用Python请求
在下面的python程序中,使用urllib3模块发出http GET请求并接收包含数据的响应。它还提供了响应代码,该响应代码也由模块中的功能管理。PoolManager对象处理连接池的所有详细信息,还处理线程安全性。
import urllib3
http = urllib3.PoolManager()
resp = http.request('GET', 'http://yiibai.com/robots.txt')
print resp.data
# get the status of the response
print resp.status
当我们运行上面的程序时,得到类似以下输出 -
User-agent: *
Disallow: /tmp
Disallow: /logs
Disallow: /rate/*
Disallow: /cgi-bin/*
Disallow: /video/video_course_view.php?*
Disallow: /video/course_view.php?*
Disallow: /videos/*
Disallow: /*/*_question_bank/*
Disallow: //*/*/*/*/src/*
200
¥ 我要打赏
纠错/补充
收藏
加QQ群啦,易百教程官方技术学习群
注意:建议每个人选自己的技术方向加群,同一个QQ最多限加 3 个群。