万维网 和 互联网不是一回事.
万维网在互联网之上运行.
互联网是传递数据的管道, 各种程序都会用, 其中传输数据最多的是 万维网, 分布在全球数百万个服务器上
万维网
万维网最基本的单位是 页面 , 可以通过页面上的超链接 访问到其他页面, 这些超链接形成巨大的互联网络, 这个就是 万维网 名字的由来
在超链接做出来之前, 你需要在文件系统中找到然后 把地址输入到地址栏,进行访问
超链接在 1945年被 Vannevar Bush 意识到, 就是那位设计了 假想计算机 Memex 的人.
Bush的形容是 " 关联式索引" , 那时候的计算机连显示器都没有, 这个想法是非常超前的.
因为超链接的强大, 拥有了自己的名字 超文本
没有页面有自己唯一的地址 , 即 统一资源定位器, 简称 URL
访问网页时, 计算机首先 做 DNS查找 , DNS给出对应的IP, 然后浏览器打开一个 TCP 连接到这个IP, 这个IP上运行着 网络服务器, 标准端口是 80端口.
下一步就是请求页面, 会用到 超文本传输协议(HTTP)
1991年创建了第一个标准 HTTP 0.9 , 只有一个 GET 指令.
状态码 放在请求前面
400~499 代表 客户端出错.
超文本 的存储和发送都是以 普通文本形式, 编码可能是 ACS II, 或 UTF-16 等
纯文本无法知道哪些是超链接, 所有必要开发一种标记方法, 因此有了 超文本标记语言(HTML )
1990年第一个版本 HTML 0.8 被创建, 有18中指令
网络浏览器 可以 和网页服务器沟通
浏览器 获取 网页和媒体 并负责展示
第一个浏览器 和 服务器, 是Tim Berners-Lee在 1990年 花了2个月写的,为了出来, 同时建立了几个基本网络标准, URL HTML HTTP . 1991年发布了出去, 万维网就此诞生.
1990年代末有很多浏览器诞生
也有很多服务器诞生, Apache 和 IIS
搜索的需求越来越大
后来这样的搜索十分的不便利, 于是开发了搜索引擎.
它有3部分组成:
01 爬虫, 跟着链接到处跑的软件
每当看到链接,就加进自己的列表中
02 不断扩张的索引, 访问的记录 出现过的词
03 查询索引的所搜算法
早期的搜索引擎排名非常简单, 取决于这个词出现的次数. 于是有人在自己的网页上 输入大量这样次.
查看是否有其他网站 指向该页面. 这样就可以避免很多垃圾网站.
网络中立性
指的是 应该平等的对待所有数据包
但是很多公司会提高数据的优先级, 让其数据包优先到达, 从而影响客户流量.