HTTP代理的几种方式
Wireshark抓包
第一种方法:直接请求
普通的提交HTTP请求的过程:直接连接远程服务器后,当连接成功时向服务器提交HTTP头,注意看看大概的格式
GET / HTTP/1.1
Accept: */*
Accept-Language: zh-cn
UA-CPU: x86
Accept-Encoding: gzip, deflate
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 1.1.4322; .NET CLR 2.0.50727)
Host: www.baidu.com
Connection: Keep-Alive(这个地方有的是keep-alive中间有空格)
再看看使用代理的连接方法
先连接代理服务器(IP地址、端口),然后向代理服务器提交这样的HTTP头
GET http://www.baidu.com/ HTTP/1.0
Accept: */*
Accept-Language: zh-cn
UA-CPU: x86
Accept-Encoding: gzip, deflate
User-Agent: Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.2; SV1; .NET CLR 1.1.4322; .NET CLR 2.0.50727)
Host: www.baidu.com
Proxy-Connection: Keep-Alive
区别就这么一点,
1、连接的不是目标服务器的IP地址和端口而是代理服务器IP地址和端口
2、提交的不是相对的地址而是绝对的HTTP地址
3、Connection: Keep-Alive 和 Proxy-Connection: Keep-Alive 的区别
Https:
Https是一个基于二进制的安全http协议,当使用https通过http代理服务时,http代理会认为这是一个安全https链接,将会放行https封包,所以我们可以使用https来欺骗http代理服务器,而我们自行构建的https封包中则可以封装我们自定义协议的真实数据(因为https是二进制的)。这一切让http代理看起来就像是我们在进行安全http连接一样。
以下是当浏览器使用Https连接代理服务器时发送的请求:
CONNECT neurospeech.com:443 HTTP/1.0 <CR><LF>
HOST neurospeech.com:443<CR><LF>
[... other HTTP header lines ending with <CR><LF> if required]>
<CR><LF> // Last Empty Line
当代理服务器收到以上指令后就认为这是一个安全的http连接(https),然后为请求中指定的服务端地址打开一个二进制流式连接,如果成功,则返回以下响应:
HTTP/1.0 200 Connection Established<CR><LF>
[.... other HTTP header lines ending with <CR><LF>..
ignore all of them]
<CR><LF> // Last Empty Line
现在,浏览器与远端主机(非代理服务器)的连接就建立起来了,并可以通过这个链接进行二进制数据的收发。
那么,当我们自己的程序要使用https来传送自己的协议数据时应该怎么办呢?
1.首先需要连接到代理服务器
2.发送 CONNECT Host:Port HTTP/1.1<CR><LF>.
3.发送 <CR><LF>.
4.等待一行字符串响应. 如果包含 HTTP/1.X 200 那么就说明链接成功建立了。
5.读取收到的响应字符串直到收到一个空行为止
6.现在,你已经通过一个http代理连接到外面的世界了,ok,开始你自己真正的数据传送吧。、