Web基础与HTTP协议
一、Web基础
1. 域名的概念
IP地址不易记忆
- 早期使用Hosts文件解析域名
主机名称重复
主机维护困难 - DNS(Domain Name System 域名系统)
分布式
层次性
2.域名空间结构
- 域名空间结构
根域
顶级域
二级域名
FQDN=主机名.DNS后缀
3.域名注册
- 域名注册是Internet中用于解决地址对应问题的一种方法
- 遵循先申请先注册原则
- 域名注册步骤
(国内注册域名可去万网注册域名)
4.网页的概念
-
网页
纯文本格式文件
编写语言为HTML
在用户的浏览器中被翻译成网页形式显示除了 -
网站
由一个一个页面构成的,是多个网页的结合体 -
主页
打开网站后出现的第一个网页称为网站主页(或首页) -
域名
浏览网页时输入的网址 -
HTTP
用来传输网页的通信协议 -
URL
是一种万维网寻址系统 -
HTML
用来编写网页的超文本标记语言 -
超链接
超链接是将网站中不同网页链接起来的功能 -
发布
将制作好的网页上传到服务器供用户访问的过程
5. HTML概念
- HTML超文本标记语言
Hyper Text Markup Language,网页的“源码”,浏览器:“解释和执行”HTML源码的工具 - HTML文档的结构
HTML网页,头部部分,标题部分,主体部分, 网页内容,包括文本、图像等
6.网页基本标签1
-
网页摘要信息的作用
有利于浏览器解析
有利于搜索引擎搜索 -
< title>标签 ,< meta>标签 ,标题标签 ,行控制相关标签 ,范围标签 ,图像标签 ,超链接标签 ,特殊符号
二、HTTP协议
1.HTTP概念
HTML叫做超文本标记语言,是一种规范,也是一种标准,它通过标记符号来标记要显示的网页中的各个部分。网页文件本身是一种文本文件,通过在文本文件中添加标记符,可以告诉浏览器如何显示其中的内容。
HTML文件可以使用任何能够生成txt文件的文本编辑器来编辑,生成超文本标记语言文件,只用修改文件名后缀为“.html”或“.htm”即可。
2.HTML的基本标签
- HTML 语法规则
HTML标签采用双标记符的形式,前后标记符对应,分别表示标记开始和结束,标记符中间的内容被标签描述。前标记符由“< XXX>”表示,结尾标记符多了一个“/”,由“< /XXX>”表示。 - HTML 文件结合
HTML文件最外层由< html> < /html>表示,说明该文件是用HTML语言描述的。在它里面是并列的头标签(< head>)和内容标签(< body>)。 - HTML 文件结构
< html>
< head>网页的头部信息
< body>网页内容
< /html>
3.头标签中常用标签
标签 | 描述 |
---|---|
< title> | 定义了文档的标题 |
< base> | 定义了页面链接标签的默认链接地址 |
< link > | 定义了一个文档和外部资源之间的关系 |
< meta> | 定义了 HTML 文档中的元数据 |
< script> | 定义了客户端的脚本文件 |
< style> | 定义了 HTML 文档的样式文件 |
4.内容标签中常用的标签
标签 | 描述 |
---|---|
< table> | 定义一个表格 |
< tr> | 定义了表格中的一行 |
< td> | 定义了表格中某一行的一列 |
< img> | 定义了一个图像 |
< a> | 定义了一个超链接 |
< p> | 定义了一行 |
< br> | 定义了换行 |
< f ont> | 定义了字体 |
< h1> | 定义字体大小 |
三、动态网页与静态网页
1.静态网页
在网站设计中,纯粹HTML格式的网页通常被称为“静态网页”,静态网页是标准的HTML文件,它的文件扩展名是.htm、.html。
静态网页是网站建设的基础,早期的网站一般都是由静态网页制作的。静态网页也可以出现各种动态的效果,如.GIF格式的动画、FLASH、滚动字幕等。这些“动态效果”只是视觉上的,与下面将要介绍的动态网页是不同的概念。
2.动态网页
所谓的动态网页,是指跟静态网页相对的一种网页编程技术。静态网页,随着HTML代码的生成,页面的内容和显示效果就基本上不会发生变化了——除非是修改页面代码。而动态网页则不然,页面代码虽然没有变,但是显示的内容却是可以随着时间、环境或者数据库操作的结果而发生改变的。动态网页URL的后缀不是.htm、.html、.shtml、.xml等静态网页的常见网页制作格式,而是以.aspx、.asp、.jsp、.php、.perl、.cgi等形式为后缀,并且在动态网页网址中有一个标志性的符号——“?”。
动态网页是基本的html语法规范与Java、PHP、C#等高级程序设计语言、数据库编程等多种技术的融合,以期实现对网站内容和风格的高效、动态和交互式的管理。因此,从这个意义上来讲,凡是结合了HTML以外的高级程序设计语言和数据库技术进行的网页编程技术生成的网页都是动态网页。
3.动态网页和静态网页的区别
静态网页和动态网页的区别在于内容是否可以随时更新、是否有交互性。静态网页的内容和排版是固定不变的,用户只能浏览内容,无法进行交互;而动态网页的内容和排版可以随时更新修改,用户可以进行交互并获取实时信息。
静态网页的优点是页面加载速度快,但内容不易更新;动态网页的优点是内容可以随时更新,但页面加载速度相对较慢。因此,在设计网站时,应根据网站的需要和用户需求来选择静态网页或动态网页。
4.动态网页语言
早期的动态网页主要采用通用网关接口 CGI(Common Gateway Interface)技术,虽然 CGI 技术已经发展成熟而且功能强大, 但由于编程困难、效率低下、修改复杂,所以有逐渐被新技术取代的趋势。
目前常用的动态网页编程语言如下:
-
PHP
即 Hypertext Preprocessor(超文本预处理器),它是当今 Internet 上最为火热的脚本语言,其语法借鉴了 C、Java、PERL 等语言,但只需要很少的编程知识你就能使用 PHP 建立一个真正交互的 Web 站点。 -
JSP
即 Java Server Pages(Java 服务器页面),它是由 Sun Microsystem 公司于 1999 年 6 月推出的新技术,是基于 Java Servlet 以及整个 Java 体系的 Web 开发技术。 -
Python
是一种面向对象、跨平台的动态类计算机程序设计语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越来越多被用于独立的大型项目开发。 -
Ruby
是一种简单快捷的面向对象(面向对象程序设计)脚本语言,在 20 世纪 90年代由日本人松本行弘(Yukihiro Matsumoto) 开发,遵守GPL 协议和Ruby License。它的灵感与特性来自于 Perl、Smalltalk、Eiffel、Ada 以及 Lisp 语言
四、HTTP 协议概述
HTTP协议采用了请求/响应模型。客户端向服务器发送一个请求,请求头包含请求的方法、URL、协议版本、以及包含请求修饰符、客户信息和内容的类似于MIME的消息结构。服务器以一个状态行作为响应,响应的内容包括消息协议的版本,成功或者错误编码加上服务器信息、实体元信息以及可能的实体内容。
1.HTTP版本介绍
HTTP(Hypertext Transfer Protocol,超文本传输协议)是一种用于传输超媒体文档(例如 HTML)的应用层协议。HTTP/1.1 是最常见的版本,但也有其他版本,如 HTTP/0.9、HTTP/1.0、HTTP/2、HTTP/3 等,它们中的大部分都是向下兼容的。
HTTP(Hypertext Transfer Protocol,超文本传输协议)是一种用于传输超媒体文档(例如 HTML)的应用层协议。HTTP/1.1 是最常见的版本,但也有其他版本,如 HTTP/0.9、HTTP/1.0、HTTP/2、HTTP/3 等,它们中的大部分都是向下兼容的。
- (1)HTTP/0.9:已过时。只接受 GET 一种请求方法,没有在通讯中指定版本号,且不支持请求头。由于该版本不支持 POST 方法,所以客户端无法向服务器传递太多信息。
- (2)HTTP/1.0:这是第一个在通讯中指定版本号的 HTTP 协议版本,至今仍被广泛采用,特别是在代理服务器中。
- (3)HTTP/1.1:引入了持久连接,即TCP连接默认不关闭,可以被多个请求复用,能很好地配合代理服务器工作。还支持管道方式机制,即在同一个TCP连接里面,客户端可以同时发送多个请求,以便降低线路负载,提高传输速度。
- (4)HTTP/2.0:完全多路复用,在一个连接里,客户端和浏览器都可以同时发送多个请求或回应,而且不用按照顺序一一对应。引入了头信息压缩机制,使用gzip或compress压缩后再发送。支持服务端推送,允许服务器未经请求,主动向客户端发送资源。
- (5)HTTP/3:基于 QUIC 协议开发,提供更快的连接建立、更好的容错机制和更高的安全性能,是未来互联网的趋势之一。
2.HTTP的方法
HTTP 支持几种不同的请求命令,这些命令被称为 HTTP 方法(HTTP method)。每条 HTTP 请求报文都包含一个方法, 告诉服务器要执行什么动作,包括:获取一个页面,运行一个网关程序,删除一个文件等。最常用的获取资源的方法是 GET、POST、PUT。
方法 | 描述 |
---|---|
GET | 对服务器资源获取的简单请求 |
PUT | 向服务器提交数据,以修改数据 |
DELETE | 删除服务器上的某些资源 |
POST | 用于发送包含用户提交数据的请求 |
HEAD | 请求页面的首部,获取资源的元信息 |
CONNECT | 用于ssl隧道的基于代理的请求 |
OPTIONS | 返回所有可用的方法,常用于跨域 |
TRACE | 追踪 请求–响应的传输路径 |
1、GET请求会向数据库发索取数据的请求,从而来获取信息,该请求就像数据库的select操作一样,只是用来查询一下数据,不会修改、增加数据,不会影响资源的内容,即该请求不会产生副作用。无论进行多少次操作,结果都是一样的。
2、PUT请求是向服务器端发送数据的,从而改变信息,该请求就像数据库的updat操作一样,用来修改数据的内容,但是不会增加数据的种类等,也就是说无论进行多少次PUT操作,其结果并没有不同。
3、DELETE请求顾名思义,就是用来删除某一个资源的,该请求就像数据库的delete操作
4、POST请求同PUT请求类似,都是向服务器端发送数据的,但是该请求会改变数据的种类等资源,就像数据库的insert操作一样,会创建新的内容。几乎目前所有的提交操作都是用POST请求的。
3.GET 和 POST 比较
GET | POST |
---|---|
GET请求能被缓存 | POST请求不能被缓存 |
GET请求会保存在浏览器的浏览纪录里 | POST请求不会保存在浏览器的浏览纪录里 |
GET请求有长度的限制 | POST请求没有长度限制 |
查询的字符串会显示在URL后缀中,不安全,比如 http://www.test.com/a.php?Id=123 | 查询的字符串不会显示在URL中,比较安全 |
4.HTTP 状态码
HTTP 状态码(HTTP Status Code)是用以表示网页服务器 HTTP 响应状态的 3 位数字代码,当浏览器请求某一 URL 时, 服务器根据处理情况返回相应的处理状态。
通常正常的状态码为2xx,3xx(如200),如果出现异常会返回4xx,5xx(如404)
状态码首位 | 范围 | 含义 |
---|---|---|
1xx | 100-101 | 信息提示 |
2xx | 200-206 | 成功 |
3xx | 300-305 | 重定向 |
4xx | 400-415 | 客户端错误 |
5xx | 500-505 | 服务器错误 |
HTTP 常见状态码
状态码 | 功能说明 |
---|---|
200 | 一切正常 |
301 | 永久重定向 |
302 | 永久重定向 |
401 | 用户名或密码错误 |
403 | 禁止访问(客户端IP地址被拒绝) |
404 | 请求的文件不存在 |
414 | 请求URI头部过长 |
500 | 服务器内部错误 |
502 | 无效网关 |
503 | 当前服务不可用 |
504 | 网关请求超时 |
注:产生502(无效网关)的原因
1、数据包没有送到网卡,网络问题;
2、数据包送进去了(交换机能抓到包),但是网卡没收到,网卡问题或防火墙问题;
3、网卡接收到了,处理不了,服务问题。(比如服务器当前连接太多,响应太慢;页面素材太多,带宽不够。)
5.HTTP 请求流程分析
用户在浏览器输入URL访问时,发起HTTP请求报文,请求中包括请求行、请求头、请求体,服务器收到请求后返回响应报文,包括状态行、响应头、响应体。
请求报文四部分:
- 请求行:请求行由请求方法、URL 以及协议版本三部分组成。
- 请求头:请求头为请求报文添加了一些附加信息,由“名/值”对组成,每行一对,名和值之间使用冒号分隔。
- 空行:请求头部的最后会有一个空行,表示请求头部结束,接下来为请求体,这一行非常重要,必不可少。
- 请求体:请求体是请求提交的参数,GET 方法已经在 URL 中指明了参数,所以提交时没有数据。POST 方法提交的参数在请求体中。
常用的响应头:
响应头 | 描述 |
---|---|
Server | 服务器应用程序软件的名称和版本 |
Content-Type | 响应正文的类型(是图片还是二进制字符串) |
Content-Length | 响应正文长度 |
Content-Charset | 响应正文使用的编码 |
Content-Encoding | 响应正文使用的数据压缩格式 |
Content-Language | 响应正文使用的语言 |
6.HTTP访问的过程
1.建立连接:客户端发送一个请求到服务端,并建立一个 TCP 连接 (三次握手)。
2.发送请求:客户端发送一个 HTTP 请求到服务端,该请求包含请求方法,URL 和协议版本等信息,以及可能还包括请求头和请求体信息。
3.处理请求:服务端接收到请求并进行处理,这个过程包括解析请求头和请求体信息,验证请求并进行一些业务处理等。
4.发送响应:服务端发送一个 HTTP 响应到客户端,该响应包含响应状态码,响应头和响应体等信息。
5.接收响应:客户端接收响应,并进行处理,包括解析响应头和响应体信息,验证响应并进行一些业务处理等。
6.关闭连接:客户端和服务端在完成请求和响应后,关闭 TCP 连接 (四次挥手)。