Web基础与HTTP协议

目录

一、HTML概述

二、HTML基本标签

1、HTML语法规则

2、HTML文件结构

三、静态网页与动态网页

1、静态网页

2、动态网页

3、动态网页语言

4、目前常用的动态网页编程语言

五、HTTP协议

1、http协议概述

2、http请求流程图

3、http版本区别

4、http方法

5、GET和POST比较

6、http状态码

7、http请求流程分析

六、总结


域名概念:

  • IP地址不易记忆,域名用于代替IP地址,方便记忆。

  • 两台主机通信,是通过IP地址访问,所以需要将域名解析成IP地址。

  • 早期使用Hosts文件解析域名,但随着域名的增多,工作量巨大,维护困难。

  • 之后使用DNS (Domain Name Server,域名服务器) 进行域名解析。

一、HTML概述

HTML叫做超文本标记语言,是一种规范,也是一种标准,它通过标记符号来标记要显示的网页中的各个部分。网页文件本身是一种文本文件,通过在文本文件中添加标记符,可以告诉浏览器如何显示其中的内容。 HTML命令可以说明文字,图形、动画、声音、表格、链接等。

HTML文件可以使用任何能够生成txt文件的文本编辑器来编辑,生成超文本标记语言文件,只用修改文件名后缀为“.html”或“.htm”即可。

二、HTML基本标签

1、HTML语法规则

HTML标签采用双标记符的形式,前后标记符对应,分别表示标记开始和结束,标记符中间的内容被标签描述。前标记符由“”表示,结尾标记符多了一个“/”,由“”表示。

2、HTML文件结构

HTML文件最外层由< html> < /html>表示,说明该文件是用HTML语言描述的。在它里面是并列的头标签(< head>)和内容标签(< body>)。

文件结构如下:

<html>  

         <head>网页的内容描述信息</head>

         <body>网页显示的内容</body>

</html>

头标签中常用的标签:

标签描述
< title>定义了文档的标题
< base>定义了页面链接标签的默认链接地址
< link>定义了一个文档和外部资源之间的关系
< meta>定义了HTML文档中的元数据
< script>定义了客户端的脚本文件
< style>定义了HTML文档的样式文件

内容标签中常用标签:

标签描述
< table>定义一个表格
< tr>定义了表格中的一行
< td>定义了表格中某一行的一列
< img>定义了一个图像
< a>定义了一个超链接
< p>定义了一行
< dr>定义了换行
< font>定义了字体

三、静态网页与动态网页

1、静态网页

在网站设计中,纯粹HTML格式的网页通常被称为“静态网页”,静态网页是标准的HTML文件,它的文件扩展名是.htm、.html。静态网页是网站建设的基础,早期的网站一般都是由静态网页制作的。

静态网页也可以出现各种动态的效果,如.GIF格式的动画、FLASH、滚动字幕等。这些“动态效果”只是视觉上的,与下面将要介绍的动态网页是不同的概念。

静态网页只要不修改代码,是不会改变的,每天展示的内容是一样的。静态网页只使用html语言,不使用其他高级程序语言。

2、动态网页

所谓的动态网页,是指跟静态网页相对的一种网页编程技术。静态网页,随着HTML代码的生成,页面的内容和显示效果就基本上不会发生变化了——除非是修改页面代码。而动态网页则不然,页面代码虽然没有变,但是显示的内容却是可以随着时间、环境或者数据库操作的结果而发生改变的。

动态网页URL的后缀不是.htm、.html、.shtml、.xml等静态网页的常见网页制作格式,而是以.aspx、.asp、.jsp、.php、.perl、.cgi等形式为后缀,并且在动态网页网址中有一个标志性的符号——“?”。

动态网页是基本的html语法规范与Java、PHP、C#等高级程序设计语言、数据库编程等多种技术的融合,以期实现对网站内容和风格的高效、动态和交互式的管理。因此,从这个意义上来讲,凡是结合了HTML以外的高级程序设计语言和数据库技术进行的网页编程技术生成的网页都是动态网页。

3、动态网页语言

早期的动态网页主要采用通用网关接口 CGI(Common Gateway Interface)技术,虽然 CGI 技术已经发展成熟而且功能强大, 但由于编程困难、效率低下、修改复杂,所以有逐渐被新技术取代的趋势。

4、目前常用的动态网页编程语言

PHP

  • 即 Hypertext Preprocessor(超文本预处理器),它是当今Internet上最为火热的脚本语言,其语法借鉴了C、Java、PERL等语言,但只需要很少的编程知识你就能使用PHP建立一个真正交互的Web站点。

JSP

  • 即Java Server Pages(Java服务器页面),它是由sun Microsystem公司于1999年6月推出的新技术,是基于Java servlet以及整个Java 体系的Web 开发技术。

Python

  • 是一种面向对象、跨平台的动态类计算机程序设计语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越来越多被用于独立的大型项目开发。

Ruby

  • 是一种简单快捷的面向对象(面向对象程序设计)脚本语言,在20世纪90年代由日本人松本行弘(Yukihiro Matsumoto)开发,遵守GPL协议和Ruby License。它的灵感与特性来自于perl、Smalltalk、Eiffel、Ada以及Lisp语言

五、HTTP协议

1、http协议概述

       HTTP协议采用了请求/响应模型。客户端向服务器发送一个请求,请求头包含请求的方法、URL、协议版本、以及包含请求修饰符、客户信息和内容的类似于MIME的消息结构。I服务器以一个状态行作为响应,响应的内容包括消息协议的版本,成功或者错误编码加上服务器信息、实体元信息以及可能的实体内容。

2、http请求流程图

请求过程:

  1. 首先将域名解析成IP地址
  2. 建立tcp连接(参考三次握手)
  3. 客户端发起请求
  4. 服务器接收到请求根据端口号.路径等找到对应资源文件,响应源代码给客户端
  5. 服务端主动断开tcp连接(参考四次挥手)

TCP三次握手:

  1. 当客户端向服务器发送请求连接的报文时: Seq序列号=x(x为随机) SYN=1(表示发送连接请求)
  2. 服务器端收到客户端发来的请求报文后,同意建立连接,则向客户端发送确认报文: Seq序列号=y(这时服务器也会产生一个序列号y,和客户端的序号不相关) Ack确认号=x+1(Seq序列号x+1,表示确认收到了客户端的请求) ACK=1(表示这是条确认请求) SYN=1(同时也发送一个建立连接的请求)
  3. 客户端进程收到服务端进程的确认后,还要向服务端给出确认,然后连接成功建立: Seq序列号=x+1(这时客户端的序号为1) Ack确认号=y+1(表示确认收到了服务器的连接请求) ACK=1(表示这是确认报文)

TCP四次挥手:

  1. 客户端发送FIN断开连接亲求报文段,半关闭了这个连接, 并进入 FIN_WAIT_1 状态。(半关闭:客户端终止发送数据,但可以接受数据)
  2. 服务器端收到客户端发来的请求报文后,同意断开连接,则向客户端发送确认报文:ACK=1(表示这是条确认请求)Seq序列号=v(这时服务器也会产生一个序列号v,和客户端的序号不相关)此时客户端进入FIN_WAIT_1 状态。
  3. 当服务器把所有的数据都发送完毕时,就发送FIN报文段断开连接请求 并进入 LAST_ACK 状态。
  4. 客户端收到服务端发来的断开连接请求后发送ACK报文段确定, 然后进入等待 TIME_WAIT 状态 , 等待一定时间未收到回复,则正常关闭。

3、http版本区别

版本区别
HTTP/0.9已过时。只接受GET一种请求方法,没有在通讯中指定版本号,且不支持请求头。由于该版本不支持poST方法,所以客户端无法向服务器传递太多信息
HTTP/1.0这是第一个在通讯中指定版本号的HTTP协议版本,至今仍被广泛采用,特别是在代理服务器中
HTTP/1.1引入了持久连接,即TCP连接默认不关闭,可以被多个请求复用,能很好地配合代理服务器工作。还支持管道方式机制即在同一个TCP连接里面,客户端可以同时发送多个请求,以便降低线路负载,提高传输速度
HTTP/2.0完全多路复用,在一个连接里,客户端和浏览器都可以同时发送多个请求或回应,而且不用按照顺序一一对应引入了头信息压缩机制,使用gzip或compress压缩后再发送。支持服务端推送,允许服务器未经请求,主动向客户端发送资源

4、http方法

      HTTP支持几种不同的请求命令,这些命令被称为HTTP方法(HTTP method)。每条HTTP请求报文都包含一个方法,告诉服务器要执行什么动作,包括:获取一个页面,运行一个网关程序,删除一个文件等。最常用的获取资源的方法是GET、POST。

HTTP方法描述
GET对服务器资源获取的简单请求
PUT向服务器提交数据,以修改数据
DELETE删除服务器上的某些资源
POST用于发送包含用户提交数据的请求
HEAD请求页面的首部,获取资源的元信息
  • GET请求会向数据库发索取数据的请求,从而来获取信息,该请求就像数据库的select操作一样,只是用来查询一下数据,不会修改、增加数据,不会影响资源的内容,即该请求不会产生副作用。无论进行多少次操作,结果都是一样的。
  • 与GET不同的是,PUT请求是向服务器端发送数据的,从而改变信息,该请求就像数据库的update操作一样,用来修改数据的内容,但是不会增加数据的种类等,也就是说无论进行多少次PUT操作,其结果并没有不同。
  • POST请求同PUT请求类似,都是向服务器端发送数据的,但是该请求会改变数据的种类等资源,就像数据库的insert操作一样,会创建新的内容。几乎目前所有的提交操作都是用POST请求的。
  • DELETE请求顾名思义,就是用来删除某一个资源的,该请求就像数据库的delete操作。

5、GET和POST比较

GET 方法

  • 从指定的服务器上获得数据
  • GET请求能被缓存
  • GET请求会保存在浏览器的浏览纪录里
  • GET请求有长度的限制
  • 主要用于获取数据
  • 查询的字符串会显示在URL后缀中,不安全

POST 方法

  • 提交数据给指定服务器处理
  • POST请求不能被缓存
  • POST请求不会保存在浏览器的浏览纪录里
  • POST请求没有长度限制
  • 查询的字符串不会显示在URL中,比较安全

6、http状态码

HTTP 状态码(HTTP Status Code)是用以表示网页服务器 HTTP 响应状态的 3 位数字代码,当浏览器请求某一 URL 时, 服务器根据处理情况返回相应的处理状态。

通常正常的状态码为2xx,3xx(如200),如果出现异常会返回4xx,5xx(如404)。

状态码分类:

状态码首位已定义范围分类
1xx100-101信息提示
2xx200-206成功
3xx300-305重定向
4xx400-415客户端错误
5xx500-505服务器错误

http常见状态码:

状态码功能描述
200一切正常
301永久重定向
302临时重定向
401用户名或密码错误
403禁止访问(客户端IP地址被拒绝)
404请求的文件不存在
414请求URL头部过长
500服务器内部错误。比如脚本错误,编程语言语法错误
502无效网关
503当前服务不可用。web服务器不能处理HTTP请求,可能是临时超载或者是服务器进行停机维护。
504网关请求超时。程序执行时间过长导致响应超时,例如程序需要执行20秒,而nginx最大响应等待时间为10秒,这样就会出现超时。

解决502错误的几种方法:

1)检查服务器连接

大多数网站都是通过多个服务器或第三方代理来运行的。如果你所在的服务器由于维护或其他原因关闭,你的网站可能会出现502 Bad Gateway Error页面。唯一的解决办法就是等待服务器完成维护或是修复好故障。

2)检查是否更改了DNS

如果你近期更改了主机服务器或将网站移动到了其他IP地址下,就会更改网站的DNS服务器。这可能导致该网站无法访问,出现502 Bad Gateway Error页面。在这些DNS更改完成之前,你的网站可能需要几个小将才能启动并运行。

3)检查服务器日志

服务器的日记的工作任务就是记录网站被访问的全过程,什么时间到什么时间有哪些人来过,什么搜索引擎来过,有没有收录你的网页。可以通过它来查看网站的健康状态。仔细检查日志内容可能会找出问题所在。

4)修复防火墙故障

网站防火墙相当于网站的守卫者,保护你的网站免受非法用户的侵入和分布式拒绝服务(DDOS)的攻击。有时,防火墙设置错误会导致防火墙将从内容分发网络(CDN)过来的访问请求视为对服务器的攻击,因此拒绝其访问,从而导致502错误网关。

5)梳理网站代码查找漏洞

如果网站的代码出现错误,服务器可能无法响应来自内容分发网络(CDN)的请求。梳理代码以查找漏洞或将代码复制到开发工具中。它将执行一个彻底的程序调试过程,该过程将模拟502错误网关是如何发生的,从而找出漏洞。

7、http请求流程分析

       用户在浏览器输入URL访问时,发起HTTP请求报文,请求中包括请求行、请求头、请求体,服务器收到请求后返回响应报文,包括状态行、响应头、响应体。

请求报文:

  • 请求行:请求行由请求方法、URL以及协议版本三部分组成。
  • 请求头:请求头为请求报文添加了一些附加信息,由名/值”对组成,每行一对,名和值之间使用冒号分隔。
  • 空行:请求头部的最后会有一个空行,表示请求头部结束,接下来为请求体,这一行非常重要,必不可少。
  • 请求体:请求体是请求提交的参数,GET方法已经在URL中指明了参数,所以提交时没有数据。POST方法提交的参数在请求体中。

常用的请求偷:

请求头描述
Host接受请求的服务器地址,可以是Ip:端口号,也可以是域名
User-Agent发送请求的应用程序名称
Connection指定与连接相关的属性,如Connection:Keep-Alive
Accept-Charset通知服务端可以发送的编码格式
Accept-Encoding通知服务端可以发送的数据压缩格式
​​​​​​​Accept-Language通知服务端可以发送的语言

响应报文:

  • 状态行:状态行由协议版本,状态码,状态码描述三部分组成。
  • 响应头:响应头与请求头部类似,为响应报文添加了一些附加信息。
  • 空行:响应头部的最后会有一个空行,表示响应头部结束。
  • 响应体:服务器返回的相应HTML数据,浏览器对其解析后显示页面。

常用的响应头:

响应头描述
Server服务器应用程序软件的名称和版本
Content-Type响应正文的类型(是图片还是二进制字符串)
Content-Length响应正文长度
Content-Charset响应正文使用的编码
Content-Encoding响应正文使用的数据压缩格式
Content-Language响应正文使用的语言

六、总结

静态页面
以.html或.htm为结尾的页面,文字图片、动态图片、视频―下载文件等

动态页面
以.php .jsp .asp等为结尾的页面,内容是由PHP ,PYTHON ,PBRL, SP等高级语言开发结合数据库实现的页面,特点页面地址带有﹖号

http
1.0 相较以前版本可以支持POST、HEAD方法,支持HTML文件以外的其他类型,但不支持持久连接
1.1支持持久连接,即在一个TCP连接里面完成多个http请求和响应,但是每个请求和响应是按照顺序一一对应的
2.0支持完全多路复用,即不光可以在在一个TcP连接里面完成多个http请求和响应,而且请求和响应不用按照顺序一一对应也支持压缩,服务端主动推送
3.0基于UDP协议
 

HTTP方法
GET:请求、查询、下载数据
PUT:提交修改数据
POST:提交上传数据DELETE册删除数据
HEAD:请求页面头部,元信息
 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值