尝试写个爬虫(3)

http请求与数据下载

http(超文本传输协议)

通常http用于传输文本信息,当然也可以传输二进制或者各种流式文件。

通信原理如下:

1.建立tcp会话连接,通常指一次socket连接;

2.client端向server端发送请求命令,即http请求头;

3.server端响应client端请求,生成http返回头,以及返回的数据,发送client端;

4.通信结束,释放本次连接。


http请求头

http请求分为两部分:

1.请求内容信息:  Method   Request-URI   HTTP-VersionCRLF

Method表示对于Request-URI完成的方法,这个字段是大小写敏感的


Request-URI:请求的资源文件路径,遵循URI格式,为(*)时,说明请求并不用于某个特定的资源地址,而是用于server本身。

HTTP-Version:表示支持的HTTP版本。

2.请求实体参数:  实体名:实体值

可用”:”或者空格或者制表符隔开



数据下载

对于一次http下载,数据分为两个部分,前一部分是http响应头信息;后一部分是http数据体。这里并不涉及数据的解析,因此将服务器发送的数据统一对待。


注意后面补上代码和测试结果



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值