目录
客户端解析到IP地址后会通过TCP的三次握手与服务器建立连接:
一、DNS与域名
1 域名和IP地址简介
- 网络是基于 TCP/IP 协议进行通信和连接的,每一台主机都有一个唯一的标识 (固定的 地址),用以区别在网络上成千上万个用户和计算机。网络在区分所有与之相 连的网络和主机时,均采用一种唯一、通用的地址格式,即每一个与网络相连接的计算机和服务器都被指派一个独一无二的地址
- 为了保证网络上每台计算机的 P 地址的唯 一性,用户必须向特定机构申请注册,分配P 地址网络中的地址方案分为两套: IP 地址系统和域名地址系统。这两套地址系统其实是-对应的关系由于 地址是数字标识,使用时难以记忆和书写,因此在 地址的基础上又发展出一种符号化的地址方案,来代替数字型的 IP地址
2.域名服务
- 分布式,每台主机维护一个部分,保持和维护域名空间的程序,响应解析器的请求
- 解析端(客户端)向DNS服务器发出请求的设备
3. 域名注册
域名注册是Internet中用于解决地址对应问题的一种方法遵循先申请先注册原则
域名注册步骤:
- 准备申请资料
- 寻找域名注册网站
- 查询域名
- 正式申请
- 申请成功
二、DNS解析
DNS解析的三种方式
1. /etc/hosts 主要用于主机之间 (IP和主机名)的映射/解析关系
linux系统中负责快速解析的文件,包含了ip与主机名的映射关系,在没有DNS服务器的情况下,使用本地/etc/hosts完成解析/映射,实现快速访问
2. /etc/resolv.conf 主要用与匹配DNS服务器
DNS客户端配置文件,主要用于设置DNS服务器的P和域名,还包含了主机域名的搜索顺序等等,这个文件是由域名解析器(resolver,一个根据主机名解析IP地址的库)使用的配置文件。
3. /etc/sysconfig/network-scripts/ifcfg-ens33
我们也可以在网卡配置文件中定义DNS1= DNS2=
生效顺序 1 hosts文件 2 网卡配置文件 3 /etc/resolv.conf
三、网页的概念
网页
- 纯文本格式文件
- 编写语言为HTML
- 在用户的浏览器中被“翻译”成网页形式显示出来
网站
- 由一个一个页面构成的,是多个网页的结合体
主页
- 打开网站后出现的第一个网页称为网站主页(或首页)
HTML
- 用来编写网页的超文本标记语言超链接
超链接
- 是将网站中不同网页链接起来的功能
发布
- 将制作好的网页上传到服务器供用户访问的过程
四、HTML概述
1.HTML超文本标记语言
- Hyper Text Markup Language
- 网页的“源码”
2. 浏览器:“解释和执行”HTML源码的工具
五、Web
1.Web概述
万维网并非某种特殊的计算机网络,是一个大规模的、联机式的信息贮藏库,使用链接的方法能非常方便地从因特网上的一个站点访问另一个站点(超链技术),具有提 供分布式服务的特点。万维网是一个分布式的超媒体系统,是超文本系统的扩充,基于B/S架构实现
- Web (World Wide Web)即全球广域网,也称为万维网
- 一种分布式图形信息系统
- 建立在Internet上的一种网络服务
2. Web1.0 vs Web2.0
2.1 Web1.0
- 以编辑为特征,网站提供给用户的内容是编辑处理后的,然后用户阅读网站提供的内容
- 这个过程是网站到用户的单向行为
- Web1.0以静态 单向阅读为主
2.2 Web2.0
- 更注重用户的交互作用,用户既是网站内容的消费者(浏览者),也是网站内容的制造者
- 加强了网站与用户之间的互动,网站内容基于用户提供,网站的诸多功能也由用户参与建设,实现了网站与用户双向的交流与参与
- Web2.0特征
用户分享、以兴趣为聚合点的社群、开放的平台,活跃的用户
3. 静态页面与动态页面
3.1 静态页面定义
- 静态网页是标准的HTML文件
- 扩展名是.htm、.html
- 是网站建设的基础,早期网站一般都由静态网页制作
- 没有后台数据库、不含程序和不可交互的网页
- 相对更新起来比较麻烦,适用于一般更新较少的展示型网站
特点
- 每个静态网页都有一个固定的URL,且URL以.htm、.html、.shtml等常见形式为后缀,而不含有"?"
- 网页内容一经发布到网站服务器上,无论是否有用户访问,每个静态网页都是保存在网站服务器上的
- 静态网页的内容相对稳定,容易被搜索引擎检索0静态网页没有数据库的支持,在网站制作和维护方面工作量较大,因此当网站信息量很大时完全依靠静态网页制作方式比较困难
- 静态网页的交互性较差,在功能方面有较大的限制
- 页面浏览速度迅速,过程无需连接数据库,开启页面速度快于动态页面
3.2 动态页面定义
- 网页 URL不固定,能通过后台与用户交互
- 在动态网页网址中有一个标志性的符号--“?”
- 常用的语言有PHP、JSP、Python、Ruby等
特点
- 交互性
网页会根据用户的要求和选择而动态改变和响应,将浏览器作为客户端界面,这将是今后WEB发展的大势所趋、 - 自动更新
无须手动地更新HTML文档,便会自动生成新的页面,可以大大节省工作量 - 时因人而变
当不同的时间,不同的人访问同一网址时会产生不同的页面
总结
- 静态页面由于很多内容都是固定的,在功能方面有很大的限制,所以交互性较差
- 动态网页则可以实现更多的功能,如用户的登录、注册、查询等
六、 HTTP协议概述
1.HTTP协议简介
- HTTP(超文本传输协议HyperText Transfer Protoco) 协议是互联网上应用最为广泛的一种网络协议,它是基于TCP协议的应用层传输协议,简单来说就是客户端和服务端进行数据传输的一种规则。
- HTTP/HTTPS是应用层上的协议,建立在传输层TCP之上,客户端通过与服务端进行TCP连接(三次握手),之后发送HTTP请求与接收HTTP响应都是通过访问Socket接口来调用TCP协议实现。
- HTTP 是一种无状态(stateless)协议,HTTP协议本身不会对发送过的请求和相应的通信状态进行持久化处理(存储,保存)。这样做的目的是为了保持HTTP协议的简单性,从而能够快速处理大量的事务,提高效率。
2.cookie和session扩展
cookie和session都为了实现的是http的短期的持久化(内存/缓存方式,查询快、效率比较高)cookie是缓存在用户端(client)浏览器中的(默认缓存一天),当下次客户端通过一个浏览器访问客户端的时候,会优先读取cookie中的缓存信息,向服务端进行请求,同时服务端收到客户端请求的时候,读取到cookie文件,知道客户端之前找的是服务器A处理的任务,为了省事儿,省资源,干脆直接讲请求直接再交给服务器A处理
区别
- cookie 省服务器性能
- session 更安全
3.HTTP 请求格式( GET / POST 方式 )
3.1 GET方式
- 请求行
请求的方式
请求的资源路径
请求的版本协议号
- 请求头(描述信息/标准化信息)
Accept:客户端可以接受的数据类型
Accept-Language:客户端可以接受的语言类型
User-Agent:浏览器的信息
Accpect-Encoding:客户端可以接受的编码格式
Host:表示请求的ip和端口号
Connection:告诉服务器请求连接如何处理
Keep-Alive:通知服务器回传数据不要马上关闭,保持一小段的连接
Closed:马上关闭
3.2 POST 请求方式
- 请求行
请求的方式
请求的资源路径
请求的协议的版本号
- 请求头
Accept:客户端可以接受的数据类型
Accept-Language:客户端可以接受的语言类型
Referer:表示请求发起时,浏览器地址栏中的地址
User-Agent:浏览器的信息
Content-Type:发送的数据类型
Content-Length:发送的数据长度
- 请求体
就是发送给服务器的数据
3.3 GET 与POST 区别
GET方法 | POST方法 |
从指定的服务器上获得数据 | 提交数据给指定服务器处理 |
GET请求能被缓存 | POST请求不能被缓存 |
GET请求会保存在浏览器的浏览纪录里(cookit) | POST请求不会保存在浏览器的浏览纪录里 |
GET请求有长度的限制 | POST请求没有长度限制 |
主要用于获取数据 | 查询的字符串不会显示在URL中,比较安全 |
查询的字符串会显示在URL中,不安全 |
七、HTTP状态码
- 当使用浏览器访问某一个URL,会根据处理情况返回相应的处理状态
- 通常正常的状态码为2xx,3xx (如200)
- 如果出现异常会返回4xx,5xx (如404)
状态码首位 | 已定义范围 | 分类 |
1xx | 100-101 | 信息提示 |
2xx | 200-206 | 成功 |
3xx | 300-305 | 重定向 |
4xx | 400-415 | 客户端错误 |
5xx | 500-505 | 服务器错误 |
生产环境常见的HTTP状态码 | ||
消息 | 描述 | |
200 | OK | 请求成功 (其后是对GET和POST请求的应答文档) |
301 | Moved Permanently | 请求的永久页面跳转 |
403 | Forbidden | 禁止访问该页面 |
404 | Not Found | 服务器无法找到被请求的页面 |
500 | Internal Server Error | 内部服务器错误 |
502 | Bad Gateway | 无效网关 |
503 | Service Unavailable | 当前服务不可用 |
504 | Gateway Timeout | 网关请求超时 |
八、HTTP协议请求流程分析
Http请求的基本流程
HTTP协议(HyperText Transfer Protocol,超文本传输协议):是一种发布和接收 HTML页面的方法。
HTTPS(Hypertext Transfer Protocol over Secure Socket Layer)简单讲是HTTP的安全版,在HTTP下加入SSL层。
SSL(Secure Sockets Layer 安全套接层)主要用于Web的安全传输协议,在传输层对网络连接进行加密,保障在Internet上数据传输的安全。
HTTP的端口号为80,
HTTPS的端口号为443;
浏览器的主要功能是向服务器发出请求,在浏览器窗口中展示您选择的网络资源,HTTP是一套计算机通过网络进行通信的规则。
HTTP请求是指 : 客户端通过发送 HTTP 请求向服务器请求对资源的访问。 它向服务器传递了一个数据块,也就是请求信息,HTTP 请求由三部分组成:请求行、请求头和请求正文。
工作原理:
1.由HTTP客户端发起一个请求,建立一个到服务器指定端口(默认是80端口)的TCP连接。 连接
2.HTTP服务器则在那个端口监听客户端发送过来的请求。一旦收到请求, 请求
3.服务器(向客户端)发回一个状态行,比如"HTTP/1.1 200 OK",和(响应的)消息,消息的消息体可能是请求的文件、错误消息、或者其它一些信息。 响应
4.客户端接收服务器所返回的信息通过浏览器显示在用户的显示屏上,然后客 http工作流程图 http工作流程图 户机与服务器断开连接。
HTTP使用TCP而不是UDP的原因在于(打开)一个网页必须传送很多数据,而TCP协议提供传输控制,按顺序组织数据,和错误纠正
客户端解析到IP地址后会通过TCP的三次握手与服务器建立连接:
首先客户端向服务器发送请求连接报文,SYN=1初始序号seq为x,这时客户端进入SYN-SENT状态。
服务器确认请求报文ACK=1,SYN=1,确认序号ACK=X+1,服务器产生的初始序号seq=y,回复客户端确认连接,此时服务器进入SYN-RCVD状态。
客户端接受后确认报文ACK=1,ACK=y+1,客户端又重组序号为x+1。TCP连接已经建立,客户端进入ESTABLISHED 状态,当服务器收到客户端的确认后,也会进入 ESTABLISHED 状态。客户端连接到IP地址,发送httpGET的请求,从服务器读取http响应。
之后断开连接时,需要通过TCP的四次挥手完成:
客户端向服务器发送断开连接请求报文,FIN=1,ACK=1,序号为u,客户端处于FIN—WAIT-1(终止等待1)状态。
服务器确认报文ACK=1,确认序号为ACK=u+1,服务器的序号为v,回复客户端,服务器服务端处于CLOSE—WAIT(关闭等待)状态。
客户端接受确认报文ACK=1,确认序号ACK=v+1,客户端重组序号为seq=u+1,客户端处于FIN—WAIT-2(终止等待2)状态,然后服务器也想让客户端断开连接,就发送了断开连接请求,FIN=1,ACK=1,服务器重组序号为w,服务器服务端处于LAST—ACK(最后确认)状态。
客户端接受后确认报文ACK=1.确认序号为ACK=w+1,客户端序号为u+1,客户端进入CLOSED(时间等待)状态,等待最长报文段寿命2*MSL,服务器确认后,立即进入关闭状态。然后进行关闭连接。