一、万维网概述
1、大家都习惯使用WWW标识网站,比如百度网站www.baidu.com。WWW是World Wide Web(万维网)的缩写。
2、万维网 www (World Wide Web)并非某种特殊的计算机网络。万维网是一个大规模的、联机式的信息储藏所。
3、万维网用链接的方法能非常方便地从互联网上的一个站点访问另一个站点,从而主动地按需获取丰富的信息,这种访问方式称为“链接"。
4、万维网的工作过程,如下图所示:
■每个万维网网点都有一个服务器进程,它不断地监听TCP的端口80,以便发现是否有浏览器向它发出连接建立请求。
■一旦监听到连接建立请求并建立了TCP连接之后,浏览器就向万维网服务器发出浏览某个页面的请求,服务器接着就返回所请求的页面作为响应。
■最后,TCP连接就被释放了。
5、万维网存在的问题:
①怎样使各种万维网文档都能在互联网上的各种计算机上显示出来,同时使用户清楚地知道在什么地方存在着超链?
超文本标记语言HTML (HyperText Markup Language)使得万维网页面的设计者可以很方便地用一个超链从本页面的某处链接到互联网上的任何一个万维网页面,并且能够在自己的计算机屏幕上将这些页面显示出来。
②用何协议实现万维网上各种超链的链接?
在万维网客户程序与万维网服务器程序之间进行交互所使用的协议,是超文本传送协议HTTP。HTTP是一个应用层协议,它使用TCP连接进行可靠的传送。
二、统一资源定位符URL
1、URL的作用
①资源定位符URL是对可以从互联网上得到的资源的位置和访问方法的一种简洁表示。
②URL给资源的位置提供一种抽象的识别方法, 并用这种方法给资源定位。
③URL相当于一个文件名在网络范围的扩展。因此URL是与互联网相连的机器上的任何可访问对象的一个指针。
2、URL的一般形式
由以冒号隔开的两大部分组成,并且在URL中的字符对大写或小写没有要求。
URL的一般形式是:<协议>:<主机or或名>:<端口>/<路径> 例如:https://www.baidu.com
注意:①端口是默认的端口时可以省略的。
②若再省略文件的<路径>项,则URL就指到该网络的根目录下的 主页。
例如:访问百度网站只要输入https://www.baidu.com,就能打开该网站的主页,不用输入端口和路径。通过主页,可以访问到该网站的全部内容,比如下载、博客、查询。
三、HTTP协议
1、HTTP是客户端浏览器和Web服务器之间的应用层通信协议。HTTP定义了浏览器访问Web服务的步骤,能够向Web服务器发送哪些请求(方法),HTTP请求报文格式(有哪些字段,分别代表什么意思),也定义了Web服务器能够向浏览器发送哪些响应(状态码),HTTP 响应报文格式(有哪些字段,分别代表什么意思)。
2、HTTP是超文本传输协议,一个网站通常由一组网页组成,其中有一个网页是首页,通过首页的超链接可以访问到该网站的其他网页,超链接也可以链接到其他网站。
3、HTTP的主要特点
■HTTP使用了面向连接的TCP作为运输层协议,保证了数据的可靠传输。
■HTTP协议本身也是无连接的,虽然它使用了面向连接的TCP向上提供的服务。
■HTTP 是面向事务的客户服务器协议。
4、HTTP的报文格式
HTTP有两类报文:
①请求报文——从客户向服务器发送请求报文。请求报文格式,如下图所示:
②响应报文——从服务器到客户的回答。响应报文格式,如下图所示:
■1xx 表示通知信息的,如请求收到了或正在进行处理。
■2xx 表示成功,如接受或知道了。
■3xx 表示重定向,表示要完成请求还必须采取进一步的行动。
■4xx 表示客户的差错,如请求中有错误的语法或不能完成。
■5xx 表示服务器的差错,如服务器失效无法完成请求。
■由于HTTP是面向正文的,因此在报文中的每一个字段都是一些ASCII码串,因而每个字段的长度都是不确定的。
5、HTML文件举例
①HTML文件内容:
<HTML>
<HEAD>
<TITLE>一个HTML的例子</TITLE>
</HEAD>
<BODY>
<H1>HTML很容易掌握</H1>
<P>这是第一个段落。虽然很短,但它仍是一个段落。</P><P>这是第二个段落。</P>
<H2>视频教学网站</H2>
< a href=" >贴吧</a> <br />
<a href="http://www. 91xueit. com >91学IT</a>
</BODY>
</HTML>
②该HTML文件呈现的网页如下图所示:
四、代理服务器
1、代理服务器的功能就是代理网络用户去取得网络信息,我们可以配置计算机通过Web代理服务器访问Web站点,而不直接访问站点。
2、代理服务器又称为万维网高速缓存,它代表浏览器发出HTTP请求。万维网高速缓存把最近的一些请求和响应暂存在本地磁盘中。当与暂时存放的请求相同的新请求到达时,万维网高速缓存就把暂存的响应发送出去,而不需要按URL的地址再去互联网访问该资源。高速缓存可以减少访问互联网服务器的时延。
3、代理服务器的应用场景
某单位为了企业信息安全,在路由器上设置了网络层防火墙,不允许研发部门的计算机访问Internet, 允许市场部门的计算机访问Internet,但研发部门的计算机能够访问市场部门的计算机。如果研发部门的计算机想访问internet,就可以在市场部门的计算机上安装web代理软件,然后研发部门员工的计算机设置浏览器使用该代理访问Internet即可。
五、在Web服务器上存放用户信息
①万维网站点可以使用Cookie来跟踪用户。
②Cookie 表示在HTTP服务器和客户之间传递的状态信息。
③使用Cookie的网站服务器为用户产生一个唯一的识别码。利用此识别码,网站就能够跟踪该用户在该网站的活动。