http协议什么是长连接服务器,爬虫学习之HTTP协议初步了解

本文介绍了HTTP协议在网络应用中的作用,通过Chrome浏览器的开发者工具展示了浏览器向服务器发送请求的过程,包括GET方法、Host头部、Connection选项、Accept字段以及User-Agent信息等关键内容。同时,讨论了服务器响应浏览器的方式,并提供了查看返回信息的方法,帮助读者深入理解HTTP协议的工作机制。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

HTTP协议简介

尽量使用谷歌/火狐/360极速浏览器

在Web应用中,服务器把网页传给浏览器,实际上就是把HTML代码发给浏览器,让浏览器显示出来,而浏览器和服务器之间的传输协议就是HTTP

HTML是一种定义网页的文本HTTP是在网络上传输HTML的协议,用于通信

在Chrome中下面的位置中或者ctrl+shift+i快捷键:

3ea92d1188b66e43906edb18306bb9a8.png

打开后的界面

546512cfe0ba3115725b3f306e530698.png

我们打开网络调试助手

770fb33b717aebbc337a4bb88a6dddee.png

进入界面

14954e5326f495c770ec3d7b7d28c295.png

接下来我们用Chrome访问我们本地服务

先启动服务,此时我们就模拟了服务器

5a5aaafd85b2a6cab528ac823e8fbc29.png

然后在浏览器中访问服务器,输入以下内容,点击回车

7f012356f1bb19598b9bb8e3658d245f.png

浏览器会进入请求状态

f6ec99a4862babc8b2c60290df8091e0.png

我们在模拟服务器中也会提取到信息

11401abfb3731e6bb384bf01d3e8ebb5.png

这些内容就是HTTP协议中的一部分内容

GET / HTTP/1.1

Host: 127.0.0.1:8080

Connection: keep-alive

Cache-Control: max-age=0

Upgrade-Insecure-Requests: 1

User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.62 Safari/537.36

Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8

Accept-Encoding: gzip, deflate, br

Accept-Language: zh-CN,zh;q=0.9

其中GET后面是/了,但是如果我们在浏览器访问中加访问内容的话它就会变化了,比如下面就不会是/了,这个GET就向服务器“要东西”。这就是协议中的意义,是有规定目的的。

be5515d3a4ea08affcfb4b4f70f16465.png

Host: 127.0.0.1:8080 这个内容就很明显了,表示访问到地址。

Connection: keep-alive 表示长连接,先记下。

Accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8 表示能接收的格式。

User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.62 Safari/537.36 表示浏览器的访问版本。这个可以练习下,用市面上常见的浏览器访问下,看下浏览器访问版本。

那么我们现在知道浏览器向服务器访问的格式,那么服务器返回给浏览器我们该怎么看呢?

比如我们访问www.baidu.com,看看返回什么?

进入浏览器,先改下位置,这样比较舒服

d02cbb7d856deef56cae2a375ac54c1a.png

调试工具就到下面了

7903e027bddc4e4d83ee947cf6665744.png

访问百度,我们看下面的地方

3493198f2b63593d298198cca9da085e.png

这里就是给浏览器的内容

1f0625500edb9adb6c178f2b15ad2c67.png

可以点击查看内容

35ad78027bc68aa719896c8163cf7d06.png

我们来看我们访问的百度地址后,返回的信息,这里面很多内容需要我们慢慢掌握

151d7c5f3bce2557b99b166cc13662d1.png

下面这个就是我们请求的内容

560242e16bc4f879bfb46322af272681.png

这个就是响应的概要内容,就可以针对性的查询协议内容

5a21d802a22ec04e6391bb8588803146.png

而主要内容是在这里:

5e0d04d9e7564151e371707a1ca59169.png

我们利用调试助手模拟服务器向浏览器发送信息,就可以查看到信息

c0219111bb61a2a94df14a07886d464e.png

举报/反馈

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值