HTTP代理与HTTP区别

最新推荐文章于 2024-07-30 02:57:21 发布

whackw

最新推荐文章于 2024-07-30 02:57:21 发布

阅读量4.5k

点赞数

分类专栏： html

html 专栏收录该内容

28 篇文章 0 订阅

订阅专栏

HTTP代理的几种方式

Wireshark抓包

第一种方法:直接请求

普通的提交HTTP请求的过程:
直接连接远程服务器后，当连接成功时向服务器提交HTTP头，注意看看大概的格式
GET / HTTP/1.1
Accept: */*
Accept-Language: zh-cn
UA-CPU: x86
Accept-Encoding: gzip, deflate
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 1.1.4322; .NET CLR 2.0.50727)
Host: www.baidu.com

Connection: Keep-Alive（这个地方有的是keep-alive中间有空格）

再看看使用代理的连接方法
先连接代理服务器（IP地址、端口）,然后向代理服务器提交这样的HTTP头
GET http://www.baidu.com/ HTTP/1.0
Accept: */*
Accept-Language: zh-cn
UA-CPU: x86
Accept-Encoding: gzip, deflate
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 1.1.4322; .NET CLR 2.0.50727)
Host: www.baidu.com
Proxy-Connection: Keep-Alive

区别就这么一点，
1、连接的不是目标服务器的IP地址和端口而是代理服务器IP地址和端口
2、提交的不是相对的地址而是绝对的HTTP地址

3、Connection: Keep-Alive 和 Proxy-Connection: Keep-Alive 的区别

Https：

Https是一个基于二进制的安全http协议，当使用https通过http代理服务时，http代理会认为这是一个安全https链接，将会放行https封包，所以我们可以使用https来欺骗http代理服务器，而我们自行构建的https封包中则可以封装我们自定义协议的真实数据（因为https是二进制的）。这一切让http代理看起来就像是我们在进行安全http连接一样。

以下是当浏览器使用Https连接代理服务器时发送的请求：

CONNECT neurospeech.com:443 HTTP/1.0 <CR><LF>
HOST neurospeech.com:443<CR><LF>
[... other HTTP header lines ending with <CR><LF> if required]>
<CR><LF> // Last Empty Line

当代理服务器收到以上指令后就认为这是一个安全的http连接（https），然后为请求中指定的服务端地址打开一个二进制流式连接，如果成功，则返回以下响应：

HTTP/1.0 200 Connection Established<CR><LF>
[.... other HTTP header lines ending with <CR><LF>..
ignore all of them]
<CR><LF> // Last Empty Line

现在，浏览器与远端主机（非代理服务器）的连接就建立起来了，并可以通过这个链接进行二进制数据的收发。

那么，当我们自己的程序要使用https来传送自己的协议数据时应该怎么办呢？

1.首先需要连接到代理服务器
2.发送 CONNECT Host:Port HTTP/1.1<CR><LF>.
3.发送 <CR><LF>.
4.等待一行字符串响应. 如果包含 HTTP/1.X 200 那么就说明链接成功建立了。
5.读取收到的响应字符串直到收到一个空行为止
6.现在，你已经通过一个http代理连接到外面的世界了，ok，开始你自己真正的数据传送吧。、

为什么百度使用https连接，却直接发GET请求，而不是先发CONNECT？

用goagent代理打印发现，其他https链接，比如维基百科，谷歌等，都是先发一次CONNECT请求，然后goagent返回“HTTP/1.1 200\r\n”，然后建立SSL连接，再接收浏览器请求，浏览器接着发GET请求。而访问百度时，直接收到GET请求，为什么呢？

添加评论

默认排序按时间排序

3 个回答

helloworlds 富有情怀并极具浪漫主义色彩的IT从业者

3 人赞同

connect请求主要用于代理，通过connect请求告诉代理，客户端接下去可能要建立一条HTTPS隧道，不要干扰我的数据。所以一般都是用户通过代理发起和目标网站的SSL握手从而进行HTTPS数据传输。
goagent应该会有一些配置判断，访问百度肯定是不需要代理翻墙的，那就没必要先发送connect请求，而是直接发送和百度的SSL握手请求，握手成功后直接发送GET请求就能正常访问了。