JJ_HH

个人学习经历

HTTP权威指南(3,5,6章)
  1. HTTP报文流

    HTTP报文是在HTTP应用程序之间发送的数据块, 以一些文本形式的元信息开头(描述报文的内容以及内容), 后面跟着可选的数据部分,在客户端,服务器和代理之间流动。 所有报文都向下游流动

  2. 报文组成

    对报文描述的起始行,包含属性的首部,可选的,包含数据的主体

    起始行和首部就是由行分隔的ASCII文本,以回车符和一个换行符结束, 写作CRLF

  3. 重定向

    永久重定向:301,某个资源被永久移除

    临时重定向:303 307,暂时移除,以后还是定位到原url

    URL增强:303,307,服务器通过重定向来重写URL,在请求到达的时候, 服务器会生成一个新的包含了嵌入式状态信息的URL,并将用户重定向到这个新的URL上去, 这是十五件维护状态的一种有效的方式。

    负载均衡:303,307,一个超载的服务器收到一个请求,服务器可以讲客户端请求重定向到一个负载不重的服务器上去

    服务器关联:303,307 Web服务器上可能有某些用户的本地信息,服务器可以将客户重定向到那个客户端信息的服务器上去

    规范目录结构:客户端请求的URI是一个不带尾部斜线的目录名时,大多数Web服务器都会将客户端重定向到一个加了斜线的Url上去,这样相对链接就可以正常工作了

  4. 服务器的连接状态

    对于持久链接,服务器要小心计算Content-length首部,不然客户端不知道响应什么时候结束

  5. 代理

    网关与代理的区别:网关是连接两个或多个不同协议的应用程序,扮演“协议转换器”的角色,代理是连接两个或多个相同协议的应用程序

    由于浏览器和服务器实现的是不同版本的HTTP,代理也经常要做一些协议转换工作

    为什么使用代理

    代理服务器可以看到并接触所有流过的HTTP流量,所以代理可以监视流量并对其修改,以实现很多有用的增值Webfuwu

    儿童过滤器

    文档访问控制:利用代理服务器在大量的Web服务器和Web资源之间实现同意的访问控制策略,创健身和跟踪机制 为防止一些经验丰富的用户蓄意raogu哦控制代理,可以静态的配置eb服务器,使其仅接受来自代理服务器的请求

    安全防火墙:代理服务器会在网络中的单一安全节点上限制那些应用层协议的数据可以流入或流出一个组织, 还可以提供用来消除病毒的Web和Email代理使用的那种挂钩程序,以便对流量进行详细的检查。

    Web缓存

    反向代理(服务器加速器):代理接受请求,也可以发起与其他服务器的请求

    内容路由器:根据因特网的流量状况以及内容类型将请求导向特定的Web服务器, 也可以实现各种服务级的请求,比如用户付费要求更高的性能,内容路由可以将请求转发到附近的复制缓存或 用户申请了过滤服务,就可以通过过滤代理来转发HTTP请求

    转码器:将内容发送给客户端之前修改内容的主体格式,在这些数据表示法3之间进行透明转换被称为转码

    匿名者:代理会主动删除HTTP报文中的身份特性,已提供高度的私密性和匿名性

    ————————–

    代理服务器种类

    出口代理:将代理固定在本网络的出口点,以便控制本地网络与大型网络之间的流量

    入口代理:常被放在ISP访问点上,用来处理来自客户的聚合请求。ISP使用缓存代理来存储常用的文档副本, 以提高用户的下载速度,降低因特网的带宽耗费

    反向代理:通常部署在网络的边缘,在Web服务器之前,在那里可以处理所有的传送给Web服务器的请求, 并只在必要时向Web服务器请求资源,或将快速的Web缓存放在较慢的服务器之前,以提高性能, 反向代理通常直接冒用Web服务器的ip和名字

    网络交换代理:可以将具有足够处理能力的代理放在网络之间的因特网对等交换点上, 通过缓存来减轻因特网节点的拥塞,并对流量进行监控

    ————————–

    代理获取流量的方式

    客户端的代理设置

    手工配置,预先配置浏览器,代理的自动配置PAC,WPAD的代理发现(使用发现机制的逐级上升策略自动的为浏览器查找合适的PAC文件)

    代理URI和服务器URI的不同

    代理URI必须使用完整的URI而服务器URI只需要部分URI(不需要方案主机或端口号)

    显示代理要求在请求报文中使用完整的URI来解决问题,虚拟主机Web服务器要求使用Host首部来承载主机和端口信息

    ————————–

    代理使用完整的和部分URI的规则:

    如果提供完整的URI,代理就应该使用这个完整的URI

    部分URI加Host首部,使用Host、首部来确定服务器的名字和端口号

    部分URI没有Host:(1)代理是代表原始服务器的替代物,就使用原始的IP和端口号。 (2)流量被拦截而且拦截者可以提供原始的IP和端口,代理就使用拦截技术提供的IP和端口号 (3)如果所有的方法都失败了,代理没有足够的信息来确定原始服务器,就必须返回错误报文

    ————————–

    代理认证:当受限的内容到达代理服务器,代理服务器可以向客户端 发送一个407 Proxy Authorization Required状态码,客户端收到就尝试获取这个证书, 然后重新发送请求,服务器应答

阅读更多
个人分类: 网络
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

不良信息举报

HTTP权威指南(3,5,6章)

最多只允许输入30个字

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭