Web基础与HTTP协议

目录

一、Web基础

1、域名的概念

2、域名的申请

3、域名注册

4、DNS解析

1./etc/hosts

2./etc/resolv.conf

3、网卡中配置

二、网页访问(HTTP/HTTPS)

1、网页基本概念

2.HTML

三、Web概述

1、Web1.0 和 Web 2.0 的区别

2、静态网页和动态网页

2.1 静态网页

四、HTTP协议概述

1、HTTP协议简介

2、HTTP1.0 和HTTP 1.1 之间的区别

3.HTTP1.1和HTTP2的区别

五、常见的状态返回码

六、HTTP协议请求 

1、工作原理

2、 http协议请求流程分析(如:访问百度)


一、Web基础

1、域名的概念

1、网络是基于 TCP/IP 协议进行通信和连接的,每一台主机都有一个唯一的固定的 IP 地址,以区别于网络上成千上万个用户和计算机。
2、网络中的地址方案分为两套:IP 地址系统和域名地址系统,两套地址系统是一一对应的。
3、由于 IP 地址是数字标识,使用时难以记忆和书写,因此在IP地址的基础上发展出一种符号化的地址方案,来代替数字型的IP地址。
4、每个符号化的地址都与特定的 IP 地址对应,这样网络上资源访问起来就比较容易的多,这个与网络上的数字型
IP地址相对应的字符型地址,就是域名。
 

早期使用Hosts文件解析域名难点

主机名称重复
主机维护困难

DNS(Domain Name System 域名系统)

分布式: 将一块整体分成若干个小部分进行处理。(将一台DNS服务器分成其它服务器,每个服务器维护一小块部分)

层次性: 将域名服务器分成各个服务器(根域、顶级域、二级域、主机域)

域名空间结构

根域: 位于域名空间的最顶层,一般用一个“ . ” 表示

顶级域: 一般代表一种类型的组织机构或国家地区。例如:(net网络公司),(com商业公司)(cn中国)

二级域: 用来标明顶级域内的一个特定的组织,国家顶级域下面的二级域名由国家网络部门统一管理,如(.com.cn)(.net.cn)(.edu.cn)

子域: 二级域下所创建的各级域统称子域,各个组织域或用户可以自由申请注册自己的域名

主机名: 主机位于域名空间的最下层,就是一台具体的计算机,如:www、mail、都是具体的计算机名字,可以用www.sina.com.cn 来表示这种方式成为 FQDN(完全合格域名) ,也是这台主机在域名中的全名。

2、域名的申请

域名注册是 Internet 中用于解决地址对应问题的一种方法
遵循先申请先注册原则
域名注册步骤: 准备申请资料——》寻找域名注册网站——》查询域名——》正式申请——》申请成功
例如:阿里云域名怎么申请?
申请查询重名给钱20-60块备案(阿里云)拍照(负责人拍照人) 10-20天申请之后就可以解析和用但是如果有问题会被封。
 

3、域名注册

域名注册是Internet中用于解决地址对应问题的一种方法遵循先申请先注册原则

域名注册步骤:

  1. 准备申请资料
  2. 寻找域名注册网站
  3. 查询域名
  4. 正式申请
  5. 申请成功

4、DNS解析

DNS解析方式,总共有三种。

生效顺序:/etc/hosts 文件 ---->网卡配置文件-----> /etc/resolv.conf 文件

1./etc/hosts

Hosts 文件是一个用于存储计算机网络中节点信息的文件,可以将主机名映射到相应的 IP 地址,实现 DNS 的功能,可以由计算机的用户进行修改控制。

2./etc/resolv.conf

DNS客户端配置文件,主要用于设置DNS服务器的iP和域名,还包含了主机域名的搜索顺序等等,
这个文件是由域名解析器(resolver,一个根据主机名解析IP地址的库)使用的配置文件。

主要用于匹配DNS服务器

示例:
nameserver   114.114.114.114  (第三方)
nameserver   8.8.8.8   (谷歌)
nameserver  218.2.135.1   (南京电信)

3、网卡中配置

在网卡配置文件中定义DNS,也可定义多个,使用DNS1和DNS2进行定义,最多3个。

二、网页访问(HTTP/HTTPS)

1、网页基本概念

网页

纯文本格式文件
编写语言为HTML
在用户的浏览器中被“翻译”成网页形式显示出来

网站

由一个一个页面构成的,是多个网页的结合体

主页

打开网站后出现的第一个网页称为网站主页(或首页)

域名

浏览网页时输入的网页
HTTP(端口:80) / HTTPS(加密|端口:443)

用来传输网页的通信协议

URL

是一种万维网地址系统,就是一条完整的地址,包括HTTP协议/HTTPD协议,加上后面域名

HTML

用来编写网页的超文本标记语言

超链接

是将网站中不同网页链接起来的功能

发布

将制作好的网页上传到服务器供用户访问的过程

2.HTML

HTML超文本标记语言

  • Hyper Text Markup Language
  • 网页的“源码”

浏览器:“解释和执行”HTML源码的工具

HTML文档的结构

  1. HTML网页
  2. 头部部分
  3. 标题部分
  4. 主体部分
  5. 网页内容,包括文本、图像等

三、Web概述

Web(world wide web) 即全球广域网,也称万维网

一种分布式图形信息系统

建立在internet上的一种网络服务

1、Web1.0 和 Web 2.0 的区别

Web 1.0

以编辑为特征,网站提供给用户的内容时编辑处理后的,然后用户阅读网站提供的内容
这个过程是网站到用户的单向行为

Web 2.0

更注重用户的交互作用,用户既是网站内容的消费者(浏览者),也是网站内容的制造者。
加强了网站与用户之间的互动,网站内容基于用户提供,网站的诸多功能也由用户参与建设,实现了网站与用户双向的交流与参与
**Web2.0 特征:**用户分享、以兴趣为聚合点的社区,开放的平台,活跃的用户

小结
web1.0 : 只能访问网站 不能进行交互 静态页面 只能看 单向
静态网页内容相对稳定,容易被搜索引擎检索

web2.0 : 交互(论坛、淘宝) 动态页面

2、静态网页和动态网页

2.1 静态网页

概述

静态网页是标准的HTML文件

扩展是 .htm 、.html

例如文本、图像、声音、Flash动画、客户端脚本和Activex控件及Java小程序等

是网站建设的基础,早期网站一般都是由静态网页制作

没有后台数据库,不含程序和不可交互的网页

相对更新起来比较麻烦,适用于一般更新较少的展示型网站

特点

每个静态网页都有一个固定的URL,且URL以.htm 、.html 、.shtml 等常见形式为后缀,而不含有 “ ?”(问号表示动态页面)

网页内容一经发布到网站服务器上,无论是否有用户访问,每个静态网页都是保存在网站服务器上的

静态网页的内容相对稳定,容易被搜索引擎检索

静态网页没有数据库的支持,在网站制作和维护方面工作量较大,因此当网站信息量很大时,完全依靠静态网页方式比较困难

静态网页的交互性较差,在功能方面有较大的限制

页面浏览速度迅速,过程无需连接数据库,开启页面速度快于动态页面

2.2 动态网页

概述

网页URL不固定,能通过后台与用户交互
在动态网页网址中有一个标志性的符号----“ ?”
常用的语言有PHP、JSP、Python、Ruby等

特点

①交互性: 网页会根据用户的要求和选择而改变和响应,将浏览器作为客户端界面,这将是今后Web发展的大势所趋。

②自动更新: 无需手动地更新HTML文档,变回自动生成新的页面,可以大大节省工作量。

③因时因人而变: 当不同的时间,不同的人访问同一网址时会产生不同的页面

四、HTTP协议概述

HTTP协议是互联网上应用最为广泛的一种网络协议,设计这个协议的目的是为了发布和接收Web服务器上的HTML页面

HTTP协议的版本

HTTP 0.9 (淘汰)
HTTP 1.0
HTTP 1.1
HTTP 2.0(使用不普遍)

1、HTTP协议简介

HTTP(超文本传输协议HyperText TransferProtocol)协议 是互联网上应用最为广泛的一种网络协议,它是基于TCP协议的应用层传输协议,简单来说就是客户端和服务端进行数据传输的一种规则。
HTTP/HTTPS是应用层上的协议 ,建立在传输层TCP之上,客户端通过与服务端进行TCP连接(三次握手),之后发送HTTP请求与接收HTTP响应都是通过访问Socket接口来调用TCP协议实现
HTTP 是一种无状态 (stateless) 协议 ,HTTP协议本身不会对发送过的请求和相应的通信状态进行持久化处理(存储,保存)。这样做的目的是为了保持HTTP协议的简单性,从而能够快速处理大量的事务,提高效率。然而,在许多应用场景中,我们需要保持用户登录的状态或记录用户购物车中的商品。由于HTTP是无状态协议,所以必须引入一些技术来记录管理状态,例如Cookie。
cookie和session都为了实现的是http的短期的持久化 (内存/缓存方式,查询快、效率比较高),cookie是缓存在用户端(client)浏览器中的(默认缓存一天), 当下次客户端通过同一个浏览器访问客户端的时候,会优先读取cookie中的缓存信息 ,向服务端进行请求,同时服务端收到客户端请求的时候,读取到cookie文件,知道客户端之前找的是服务器A处理的任务,为了省事儿,省资源,干脆直接讲请求直接再交给服务器A处理。

cookie 省服务器性能,session 更安全

2、HTTP1.0 和HTTP 1.1 之间的区别

在HTTP1.0中主要使用header里的If-Modified-Since,Expires来做为缓存判断的标准,HTTP1.1则引入了更多的缓存控制策略例如Entity tag,If-Unmodified-Since, If-Match, If-None-Match等更多可供选择的缓存头来控制缓存策略。
HTTP/1.0每进行一次HTTP通信,都需要经历建立TCP连接、传输HTTP数据和断开TCP连接三个阶段。HTTP/1.1中增加了持久连接的方法,它的特点是在一个TCP连接上可以传输多个HTTP 请求,只要浏览器或者服务器没有明确断开连接,那么该TCP连接会一直保持。HTTP的持久连接可以有效减少TCP建立连接和断开连接的次数,这样的好处是减少了服务器额外的负担,并提升整体HTTP的请求时间。

3.HTTP1.1和HTTP2的区别

虽然HTTP/1.1采取了很多优化资源加载速度的策略,也取得了一定的效果,但是HTTP/1.1对带宽的利用率却并不理想,这也是HTTP/1.1的一个核心问题:TCP的慢启动和TCP连接之间的竞争问题。HTTP/2的解决方案可以总结为:一个域名只使用一个TCP连接和消除队头阻塞问题。

五、常见的状态返回码

 

生产常见的HTTP状态码

六、HTTP协议请求 

1、工作原理

由HTTP客户端发起一个请求,建立一个到服务器指定端口(默认是80端口)的TCP连接。 连接
HTTP服务器则在那个端口监听客户端发送过来的请求。一旦收到请求, 请求
服务器(向客户端)发回一个状态行,比如"HTTP/1.1 200 OK",和(响应的)消息,消息的消息体可能是请求的文件、错误消息、或者其它一些信息。 响应
客户端接收服务器所返回的信息通过浏览器显示在用户的显示屏上,然后客 http工作流程图 http工作流程图 户机与服务器断开连接。
HTTP使用TCP而不是UDP的原因在于(打开)一个网页必须传送很多数据,而TCP协议提供传输控制,按顺序组织数据,和错误纠正

2、 http协议请求流程分析(如:访问百度)

1、用户在浏览器中输入www.baidu.com来访问

2、访问时,需要进行域名解析来获取ip,此时会使用到DNS域名解析中的递归和迭代

递归:①先查看本地缓存 ②/etc/hosts(ip映射 网卡配置) ③/etc/resolv.conf(DNS客户端配置--指向本地DNS)④网卡的DNS (network配置文件)

迭代:请求DNS域名解析系统来帮助解析

此时会从跟域、跟域服务器开始、依次解析(顶级域、二级域、子域、主机名),解析成功后,返回给客户端
3、客户端解析到IP地址后会通过TCP的三次握手与服务器建立连接

三次握手:第一次握手:PC1向PC2发送(SYN=1)请求连接报文(同步已发送状态)
第二次握手:PC2收到PC1的请求连接的信息后,然后给PC1发送消息,表示自己已经收到了,并且同意连接。此时发送的(SYN=1 ACK=1)(同步已接受状态)
第三次握手:PC1收到PC2的信息后,还要给PC2发消息确认自己已经收到了(已建立链接状态) 此时发送的ACK=1

4、基于http/https协议进行数据交互(读取cookie)


 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值