文章目录
1.Web基础
1.1 域名概述
DNS(域名系统)
分布式 :
将一块整体分层若干个小部分进行处理,(将一台DNS服务器分成其他服务器,每个服务器维护一小块部分)
层次性:
将域名服务器分成各个服务器(根域、顶级域、二级域、子域、主机名)
域名空间结构
-
根域:
位于域名空间的最顶层,一般用一个==“ . ” ==表示 -
顶级域:
一般代表一种类型的组织机构或国家地区。 -
二级域:
用来标明顶级域内的一个特定的组织,国家顶级域下面的二级域名由国家网络部门统一管理. -
子域:
二级域下所创建的各级域统称子域,各个组织域或用户可以自由申请注册自己的域名. -
主机名:
主机位于域名空间的最下层,就是一台具体的计算机,可以用www.sina.com.cn 来表示这种方式成为 FQDN(完全合格域名),也是这台主机在域名中的全名。
1.2 DNS解析的三种用法
/etc/hosts
Linux系统中负责快速解析的文件,包含了ip与主机名的映射关系,在没有DNS服务器的情况下,使用本地/etc/hosts完成解析/映射,实现快速访问,主要用于主机之间(IP和主机名)的映射/解析关系.
/etc/resolv.conf
DNS客户端配置文件,主要用于设置DNS服务器的P和域名,还包含了主机域名的搜索顺序等等,这个文件是由域名解析器(resolver,一个根据主机名解析IP地址的库)使用的配置文件。
主要用与匹配DNS服务器
在网卡配置文件中定义
/etc/ sysconfig/ network-scripts/ifcfg-ens33
DNS1=114.114.114.114
DNS2=8.8.8.8
★生效顺序:hosts文件 >> 网卡配置文件 >> /etc/resolv.conf
地址分配
网络上交互是基于TCP/IP协议的,每个主机在逻辑上有一个唯一位置标识(IP地址),物理地址为MAC地址。为了保证地址唯一性,用户协议特地向机构申请注册,分配网络中的IP地址有以下两种方案:
- IP地址系统
- 域名地址系统
2.网页
2.1 网页概述
网页
纯文本格式文件
编写语言为HTML
在用户的浏览器中被“翻译”成网页形式显示出来
网站
由一个一个页面构成的,是多个网页的结合体
主页
打开网站后出现的第一个网页称为网站主页(或首页)
域名
浏览网页时输入的网页
HTTP(端口:80) HTTPS(加密|端口:443)
用来传输网页的通信协议
URL
是一种万维网地址系统,就是一条完整的地址,包括HTTP议/HTTPD协议,加上后面域名.
HTML
用来编写网页的超文本标记语言
超链接
是将网站中不同网页链接起来的功能
发布
将制作好的网页上传到服务器供用户访问的过程
HTML文档的结构
1.html网页
2.头部部分
3.标题
4.主体
5.内容
HTML网页
头部部分
标题部分
主体部分
网页内容,包括文本、图像等
2.2 常用标签
头标签中常用标签:
标签 | 描述 |
---|---|
<title> | 定义了文档的标题 |
<base> | 定义了页面链接标签的默认链接地址 |
<link> | 定义了一个文档和外部资源之间的关系 |
<meta> | 定义了 HTML 文档中的元数据 |
<script> | 定义了客户端的脚本文件 |
<style> | 定义了 HTML 文档的样式文件 |
内容标签中常用标签:
标签 | 描述 |
---|---|
<table> | 定义一个表格 |
<tr> | 定义了表格中的一行 |
<td> | 定义了表格中某一行的一列 |
<img> | 定义了一个图像 |
<a> | 定义了一个超链接 |
<p> | 定义了一行 |
<br> | 定义了换行 |
<font> | 定义了字体 |
<h1> | 定义字体大小 |
2.3 静态网页与动态网页
静态网页
-
在网站设计中,纯粹HTML格式的网页通常被称为“静态网页”,静态网页是标准的HTML文件,它的文件扩展名是.htm、.html。
-
静态网页也可以出现各种动态的效果,如.GIF格式的动画、FLASH、滚动字幕等,这些“动态效果”只是视觉上的.
动态网页
-
动态网页,是指跟静态网页相对的一种网页编程技术。
-
动态网页的页面代码虽然没有发生变化,但是显示的内容却是可以随着时间、环境或者数据库操作的结果而发生改变的。
-
动态网页URL的后缀不是.htm、.html、.shtml、.xml等静态网页的常见网页制作格式,而是以.aspx、.asp、.jsp、.php、.perl、.cgi等形式为后缀。
-
在动态网页网址中有一个标志性的符号——“?”。
-
动态网页是基本的html语法规范与Java、PHP、C#等高级程序设计语言、数据库编程等多种技术的融合,以期实现对网站内容和风格的高效、动态和交互式的管理。
-
凡是结合了HTML以外的高级程序设计语言和数据库技术进行的网页编程技术生成的网页都是动态网页。
动态网页语言
早期的动态网页主要采用通用网关接口 CGI(Common Gateway Interface)技术,虽然 CGI 技术已经发展成熟而且功能强大, 但由于编程困难、效率低下、修改复杂,所以有逐渐被新技术取代的趋势。
目前常用的动态网页编程语言如下:
编程语言 | 描述 |
---|---|
PHP | 即 Hypertext Preprocessor(超文本预处理器),它是当今 Internet 上最为火热的脚本语言,其语法借鉴了 C、Java、PERL 等语言,但只需要很少的编程知识你就能使用 PHP 建立一个真正交互的 Web 站点 |
JSP | 即Java Server Pages(Java 服务器页面),它是由Sun Microsystem 公司于 1999 年 6 月推出的新技术,是基于 Java Servlet 以及整个 Java 体系的 Web 开发技术 |
Python | 是一种面向对象、跨平台的动态类计算机程序设计语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越来越多被用于独立的大型项目开发 |
Ruby | 是一种简单快捷的面向对象(面向对象程序设计)脚本语言,在 20 世纪 90年代由日本人松本行弘(Yukihiro Matsumoto) 开发,遵守GPL 协议和Ruby License。它的灵感与特性来自于 Perl、Smalltalk、Eiffel、Ada 以及 Lisp 语言 |
3.HTTP协议
3.1 http协议概述
HTTP协议采用了请求/响应模型。客户端向服务器发送一个请求,请求头包含请求的方法、URL、协议版本、以及包含请求修饰符、客户信息和内容的类似于MIME的消息结构。服务器以一个状态行作为响应,响应的内容包括消息协议的版本,成功或者错误编码加上服务器信息、实体元信息以及可能的实体内容。
HTTP已经演化出了很多版本,它们中的大部分都是向下兼容的。
协议版本 | 描述 |
---|---|
HTTP/0.9 | 已过时。只接受 GET 一种请求方法,没有在通讯中指定版本号,且不支持请求头。由于该版本不支持 POST 方法,所以客户端无法向服务器传递太多信息 |
HTTP/1.0 | 这是第一个在通讯中指定版本号的 HTTP 协议版本,至今仍被广泛采用,特别是在代理服务器中 |
HTTP/1.1 | 引入了持久连接,即TCP连接默认不关闭,可以被多个请求复用,能很好地配合代理服务器工作。还支持管道方式机制,即在同一个TCP连接里面,客户端可以同时发送多个请求,以便降低线路负载,提高传输速度 |
HTTP/2.0 | 完全多路复用,在一个连接里,客户端和浏览器都可以同时发送多个请求或回应,而且不用按照顺序一一对应。引入了头信息压缩机制,使用gzip或compress压缩后再发送。支持服务端推送,允许服务器未经请求,主动向客户端发送资源 |
3.2 HTTP方法
HTTP支持几种不同的请求命令,这些命令被称为 HTTP 方法(HTTP method)。每条 HTTP 请求报文都包含一个方法, 告诉服务器要执行什么动作,包括:获取一个页面,运行一个网关程序,删除一个文件等。最常用的获取资源的方法是 GET、POST、PUT。
HTTP方法 | 描述 |
---|---|
GET | 对服务器资源获取的简单请求 |
PUT | 向服务器提交数据,以修改数 |
DELETE | 删除服务器上的某些资源 |
POST | 用于发送包含用户提交数据的请求 |
HEAD | 请求页面的首部,获取资源的元信息 |
-
GET请求会向数据库发索取数据的请求,从而来获取信息,该请求就像数据库的select操作一样,只是用来查询一下数据,不会修改、增加数据,不会影响资源的内容,即该请求不会产生副作用。无论进行多少次操作,结果都是一样的。
-
与GET不同的是,PUT请求是向服务器端发送数据的,从而改变信息,该请求就像数据库的update操作一样,用来修改数据的内容,但是不会增加数据的种类等,也就是说无论进行多少次PUT操作,其结果并没有不同。
-
POST请求同PUT请求类似,都是向服务器端发送数据的,但是该请求会改变数据的种类等资源,就像数据库的insert操作一样,会创建新的内容。几乎目前所有的提交操作都是用POST请求的。
-
DELETE请求顾名思义,就是用来删除某一个资源的,该请求就像数据库的delete操作
3.3 GET和POST比较
GET 方法:
- 从指定的服务器上获得数据
- GET请求能被缓存
- GET请求会保存在浏览器的浏览纪录里
- GET请求有长度的限制
- 主要用于获取数据
- 查询的字符串会显示在URL后缀中,不安全,比如 http://www.test.com/a.php?Id=123
POST 方法:
- 提交数据给指定服务器处理
- POST请求不能被缓存
- POST请求不会保存在浏览器的浏览纪录里
- POST请求没有长度限制
- 查询的字符串不会显示在URL中,比较安全
3.4 HTTP状态码
HTTP 状态码(HTTP Status Code)是用以表示网页服务器 HTTP 响应状态的 3 位数字代码,当浏览器请求某一 URL 时,服务器根据处理情况返回相应的处理状态。
通常正常的状态码为2xx,3xx(如200),如果出现异常会返回4xx,5xx(如404)。
状态码首位 | 已定义范围 | 分类 |
1xx | 100-101 | 信息提示 |
2xx | 200-206 | 成功 |
3xx | 300-305 | 重定向 |
4xx | 400-415 | 客户端错误 |
5xx | 500-505 | 服务器错误 |
HTTP常见状态码
状态码 | 功能描述 |
---|---|
200 | 一切正常 |
301 | 永久重定向 |
302 | 临时重定向 |
401 | 用户名或密码错误 |
403 | 禁止访问(客户端IP地址被拒绝) |
404 | 请求的文件不存在 |
414 | 请求URI头部过长 |
500 | 服务器内部错误 |
502 | 无效网关 |
503 | 当前服务不可用 |
504 | 网关请求超时 |
3.5 HTTP请求流程分析
用户在浏览器输入URL访问时,发起HTTP请求报文,请求中包括请求行、请求头、请求体,服务器收到请求后返回响应报文,包括状态行、响应头、响应体。
请求报文
请求行:
请求行由请求方法、URL 以及协议版本三部分组成。
请求头:
请求头为请求报文添加了一些附加信息,由“名/值”对组成,每行一对,名和值之间使用冒号分隔。
空行:
请求头部的最后会有一个空行,表示请求头部结束,接下来为请求体,这一行非常重要,必不可少。
请求体:
请求体是请求提交的参数,GET 方法已经在 URL 中指明了参数,所以提交时没有数据。POST 方法提交的参数在请求体中。
HTTP请求报文结构:
常用的请求头:
请求头 | 描述 |
---|---|
Host | 接受请求的服务器地址,可以是 IP:端口号,也可以是域名 |
User-Agent | 发送请求的应用程序名称 |
Connection | 指定与连接相关的属性,如 Connection:Keep-Alive |
Accept-Charset | 通知服务端可以发送的编码格式 |
Accept-Encoding | 通知服务端可以发送的数据压缩格式 |
Accept-Language | 通知服务端可以发送的语言 |
响应报文
状态行:
状态行由协议版本,状态码,状态码描述三部分组成。
响应头:
响应头与请求头部类似,为响应报文添加了一些附加信息。
空行:
响应头部的最后会有一个空行,表示响应头部结束。
响应体:
服务器返回的相应 HTML 数据,浏览器对其解析后显示页面。
HTTP响应报文结构:
常见响应头:
响应头 | 描述 |
---|---|
Server | 服务器应用程序软件的名称和版本 |
Content-Type | 响应正文的类型(是图片还是二进制字符串) |
Content-Length | 响应正文长度 |
Content-Charset | 响应正文使用的编码 |
Content-Encoding | 响应正文使用的数据压缩格式 |
Content-Language | 响应正文使用的语言 |
3.6 断开连接
在服务器响应完毕后,一次会话就结束了,请问这时候连接会断开吗?
长短连接
是否断开我们需要区分HTTP版本:
-
在HTTP/1.0版本的时候,客户端与服务器完成一个请求/响应之后,会将之前建立的TCP连接断开,下次请求的时候又要重新建立TCP连接,这也被称为短连接。
-
HTTP/1.1版本发布并带来一个新的功能——长连接:在客户端与服务器完成一次请求/响应之后,允许不断开TCP连接,这意味着下次请求就直接使用这个TCP连接而不再需要重新握手建立新连接
注意:
长连接是指一次TCP连接允许多次HTTP会话,HTTP永远都是一次请求/响应,会话结束,HTTP本身不存在长连接之说。
长连接优缺点
对于服务器来说建立长连接有优点也有缺点:
优点:
当网站中有大量静态资源(图片、css、js等)就可以开启长连接,这也几张图片就可以通过一次TCP连接发送。
缺点:
当客户端请求一次时候不在请求,而服务器却开着长连接资源被占用着,这是严重浪费资源,是否开启长连接,长连接时间都需要根据网站自身来合理设置。
4.三次握手和四次挥手
4.1 三次握手
客户端:
发送SYN请求报文 (SYN=1 seq=x)
服务器端:
收到请求连接,同意请求,发送ACK/SYN报文(ACK=1 SYN=1 seq=y ack=x+1)
客户端:
收到服务器同意报文,确认连接,发送ACK报文=(ACK=1 seq=x+1 ack=y+1)
4.2 四次挥手
客户端:
发送请求断开连接请求,发送FIN报文(FIN=1 seq=u)
服务器端:
收到断开请求发送ACK报文(ACK=1 seq=v ack=u+1)
服务器端:
发送同意断开FIN/ACK报文(FIN=1 ACK=1 seq=v+1 ack=u+1)
客户端:
确认断开连接发送ACK报文(ACK=1 seq=u+1 ack=w+1)
注意:
在建立TCP连接时是三次握手,而断开TCP连接是四次挥手!