web基础与HTTP协议

web基础与HTTP协议

一. web基础

1.网页的概念

网页

纯文本格式文件

编写语言为HTML

在用户的浏览器中被“翻译”成网页形式显示出来

网站

由一个一个页面构成的,是多个网页的结合体

主页

打开网站后出现的第一个网页称为网站主页(或首页)

域名

浏览网页时输入的网址

HTTP***/HTTPS**

用来传输网页的通信协议(是否加密),是一种通讯/交互的标准/规范

URL

是一种万维网寻址系统

HTML

用来编写网页的超文本标记语言

超链接

超链接是将网站中不同网页链接起来的功能

发布

将制作好的网页上传到服务器供用户访问的过程

二.HTML概述

1.HTML超文本标记语言

hyper text markup language

网页的“源码”

2.HTML文档的结构

HTML网页

头部部分

标题部分

主体部分

网页内容,包括文本。图像等

<html>
<head>
<title>我的第一个网页</title>
</head>

<boby>
   Hello World
</body>


</html>

三. 网页基本标签

网页摘要信息的作用

有利于浏览器解析

有利于搜索引擎搜索

**标题标签**      <h1>      </h1>

**行控制相关标签**  <p>      </p>

**范围标签**       <span>      </span>

**图像标签**      <img  src="linux.jpg"/>

**超链接标签**      <a 后面跟链接  >         </a>

**特殊符号**

四.web概述

web即全球广域网,也称为万维网

一种分布式图形信息系统

建立在lnternet上的一种网络服务
在这里插入图片描述

web1.0

以编辑为特征,网站提供给用户的内容是编辑处理后的,然后用户阅读网站提供的内容

这个过程是网站到用户的单向行为

web2.0

更注重用户的交互作用,用户既是网站内容的消费者(浏览者),也是网站内容的制造者

加强了网站与用户之间的互动,网站内容基于用户提供,网站的诸多功能也由用户参与建设,实现了网站与用户双向的交流与参与

web2.0特征

用户分享,以兴趣为聚合点的社群,开放的平台,活跃的用户

静态网页

静态网页时标准的HTML文件

扩展名是.htm , .html

文本,图像,声音,Flash动画,客户端脚本和ActiveX控制及java小程序等

是网站建设的基础,早期网站一般都由静态网页制作

没有后台数据库,不含程序和不可交互的网页

相对更新起来比较麻烦,适用于一般更新较少的展示型网站

静态网页特点

每个静态网页都有一个固定的URL,且URL以.htm、.html、.shtml等常见形式为后缀,而不含有“?”

■ 网页内容一经发布到网站服务器上,无论是否有用户访问,每个静态网页都是保存在网站服务器上的

■ 静态网页的内容相对稳定,容易被搜索引擎检索

■ 静态网页没有数据库的支持,在网站制作和维护方面工作量较大,因此当网站信息量很大时完全依靠静态网页制作方式比较困难

■ 静态网页的交互性较差,在功能方面有较大的限制

■ 页面浏览速度迅速,过程无需连接数据库,开启页面速度快于动态页面

动态网页

网页URL不固定,能通过后台与用户交互

在动态网页网址中有一个标志性的符号——“?”

常用的语言有PHP、JSP、Python、Ruby等

动态网页的特点

■ 交互性

● 网页会根据用户的要求和选择而动态改变和响应,将浏览器作为客户端界面,这将是今后WEB发展的大势所趋

■ 自动更新

● 无须手动地更新HTML文档,便会自动生成新的页面,可以大大节省工作量

■ 因时因人而变

● 当不同的时间,不同的人访问同一网址时会产生不同的页面

HTTP协议

HTTP(超文本传输协议 HyperText Transfer Protocol)协议是互联网上应用最为广泛的一种网络协议,它是基于TCP协议的应用层传输协议,简单来说就是客户端和服务端进行数据传输的一种规则。

HTTP/HTTPS是应用层上的协议,建立在传输层TCP之上,客户端通过与服务端进行TCP连接(三次握手),之后发送HTTP请求与接收HTTP响应都是通过访问Socket接口来调用TCP协议实现。

HTTP 是一种无状态(stateless)协议,HTTP协议本身不会对发送过的请求和相应的通信状态进行持久化处理(存储,保存)。这样做的目的是为了保持HTTP协议的简单性,从而能够快速处理大量的事务,提高效率。

然而,在许多应用场景中,我们需要保持用户登录的状态或记录用户购物车中的商品。由于HTTP是无状态协议,所以必须引入一些技术来记录管理状态,例如Cookie。

cookie和session都为了实现的是http的短期的持久化(内存/缓存方式,查询快、效率比较高)cookie是缓存在用户端(client)浏览器中的(默认缓存一天),当下次客户端通过同一个浏览器访问客户端的时候,会优先读取cookie中的缓存信息,向服务端进行请求,同时服务端收到客户端请求的时候,读取到cookie文件,知道客户端之前找的是服务器A处理的任务,为了省事儿,省资源,干脆直接讲请求直接再交给服务器A处理

两者对比:
cookie省服务器性能
session更安全
1.为后面服务、集群、功能优化做铺垫
2.具体解释了怎么解决HTTP无状态协议的持久化/存储

■ HTTP协议的版本:

● HTTP 0.9

● HTTP 1.0

● HTTP 1.1

● HTTP 2.0

HTTP1.0和HTTP1.1之间的区别

① 缓存处理

在HTTP1.0中主要使用header里的If-Modified-Since,Expires来做为缓存判断的标准,HTTP1.1则引入了更多的缓存控制策略例如Entitytag,If-Unmodified-Since,If-Match,If-None-Match等更多可供选择的缓存头来控制缓存策略。

② 带宽优化及网络连接的使用

HTTP1.0中,存在一些浪费带宽的现象,例如客户端只是需要某个对象的一部分,而服务器却将整个对象送过来了,并且不支持断点续传功能,HTTP1.1则在请求头引入了range头域,它允许只请求资源的某个部分,即返回码是206 (Partial Content),这样就方便了开发者自由的选择以便于充分利用带宽和连接

③ 错误通知的管理
在HTTP1.1中新增了24个错误状态响应码,如409 (Conflict) 表示请求的资源与资源的当前状态发生冲突;410 (Gone) 表示服务器上的某个资源被永久性的删除

④ Host头处理
在HTTP1.0中认为每台服务器都绑定一个唯一的IP地址,因此,请求消息中的RZ并没有传递主机名 (hostname)。但随着虚拟主机技术的发展,在一台物理服务器上可以存在多个虚拟主机 (Multi-homed web Servers),并且它们共享一个ie地址。HTTP1.1的请求消息和响应消息都应支持Host头域,且请求消息中如果没有inost头域会报告一个错误 (400 Bad Request )

⑤ 长连接
HTTP1.1支持长连接(PersistentConnection) 和请求的流水线 (Pipelining) 处理,在一个TCP连接上可以传送多个HTT请求和响应,减少了建立和关闭连接的消耗和延迟,在HTTP1.1中默认开启connection: keep-alive,一定程度上弥补了HTTP1.0每次请求都要创建连接的缺点

HTTP方法

HTTP协议有多种获得Web资源的方法

HTTP方法描述
GET请求获取Request-URI所标识的资源
PUT请求服务器存储一个资源,并用Request-URl作为其标识
DELETE请求服务器删除Request-URI所标识的资源
POST在Request-URI所标识的资源后附加新的数据
HEAD请求获取由Request-URI所标识的资源的响应消息报头

GET和POST方法区别的简单理解

GET方法:

从指定的服务器上获得数据

GET请求能被缓存

GET请求会保存在浏览器的浏览记录里(cookie)

GET请求有长度的限制

主要用于获取数据

查询的字符串会显示在URL中,不安全

POST方法:

提交数据给指定服务器处理

POST请求不能被缓存

POST请求不会保存在浏览器的浏览记录里

POST请求没有长度限制

查询的字符串不会显示在URL中,比较安全

HTTP状态码

当使用浏览器访问某一个URL,会根据处理情况返回相应的处理状态

通常正常的状态码为2xx,3xx (如200)

如果出现异常会返回4xx,5xx (如404)

状态码首位已定义范围分类
1xx100-101信息提示
2xx200-206成功
3xx300-305重定向
4xx400-415客户端错误
5xx500-505服务器错误

生产环境常见的HTTP状态码

状态码描述解释
200OK请求成功(其后是对GET和POST请求的应答文档)
301Moved Permanently请求的永久页面跳转
403Forbidden禁止访问该页面
404Not Found服务器无法找到被请求的页面
500Internal Server Error内部服务器错误
502Bad Gateway无效网关
503Service Unavailable当前服务不可用
504Gateway Timeout网关请求超时

HTTP协议请求流程分析

用户输入URL(地址链接)(www.baidu.com)
客户端获取到端口及主机名后,客户端利用DNS解析域名,首先客户端的浏览器会先找自身的缓存,如果有解析结束,如果没有客户端会去找host文件,如果host文件没有的话,客户端会去找本地的DNS缓存服务器,本地的DNS缓存服务器没有的话,缓存服务器会去找根域,根域没有,会返回一个 .com. 然后本地缓存服务器会去找顶级域,顶级域没有的话会返回 baidu.com. ,然后本地缓存服务器会去找二级域,二级域解析完后会返回客户端。
|
| 504 | Gateway Timeout | 网关请求超时 |

HTTP协议请求流程分析

用户输入URL(地址链接)(www.baidu.com)
客户端获取到端口及主机名后,客户端利用DNS解析域名,首先客户端的浏览器会先找自身的缓存,如果有解析结束,如果没有客户端会去找host文件,如果host文件没有的话,客户端会去找本地的DNS缓存服务器,本地的DNS缓存服务器没有的话,缓存服务器会去找根域,根域没有,会返回一个 .com. 然后本地缓存服务器会去找顶级域,顶级域没有的话会返回 baidu.com. ,然后本地缓存服务器会去找二级域,二级域解析完后会返回客户端。
客户端解析到IP地址后会通过TCP的三次握手与服务器建立连接

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值