Web服务集群——HTTP协议和web基础


一、网页访问

HTTP:端口tcp80
HTTPS:端口tcp443

1、网页基本概念

  • 网页
    纯文本格式文件、编写语言为HTML、HTML5(html的加强版)
    在用户的浏览器中被“翻译”成网页形式显示出来
  • 网站
    由一个一个页面构成的,是多个网页的结合体
  • 主页
    打开网站后出现的第一个网页称为网站主页(或首页)
  • 域名
    浏览网页时输入的网址
  • HTTP/HTTPS
    用来传输网页的通信协议(是否加密),是一种通讯/交互的标准/规范
  • URL
    是一种万维网寻址系统;在万维网中一个具体的地址
  • HTML
    激活Window
    用来编写网页的超文本标记语言
  • 超链接
    超链接是将网站中不同网页链接起来的功能
  • 发布
    将制作好的网页.上传到服务器供用户访问的过程

HTTPS是以安全为目标的HTTP通道,s代表SSL,用于加密

2、HTML

2.1、概述

HTML(Hyper Text Markup Language)超文本标记语言,是网页的“源码”,是浏览器的“解释和执行”HTML源码的工具

  • HTML文档的结构(HTML网页)
    • 头部部分
    • 标题部分
    • 主体部分
    • 网页内容,包括文本、图像等

2.2、网页的基本标签

  • 标题标签
  • 行控制相关标签
  • 段落标签
  • 换行标签
  • 特殊符号
<!DOCTYPE html>
<html>
<head>   ##头部部分
        <meta charset="UTF-8">  ##<meta>标签
        <title>林依晨</title>   #<title>标题标签
</head>
<body>
<h1>全世界的人都知道</h1>       ##标题标签
<h2>全世界的人都知道</h2>
<h3>全世界的人都知道</h3>
<h4>全世界的人都知道</h4>
<h5>全世界的人都知道</h5>
<h5>全世界的人都知道</h6>
<p>在见到你关键的第一秒</p>    ##段落标签
<p>爱的情愫开始发酵</p>
<p>小心翼翼&ensp;写给你的纸条</p>  ##&ensp; 空格
<span>你像一座孤傲的岛</span>   ##范围标签
<hr/>    ##水平线标签      ##换行标签
<br/>有自己的城堡
<br/>我是上不了岸的潮
<h1>全世界的人都知道</h1>
<strong>也只能将你围绕</strong> <br/>   ##文本加粗标签
<em>也只能将你围绕</em>   ##文本倾斜标签

#特殊符号
<br/>&gt;全世界的人都知道     ##>
<br />&lt;全世界的人都知道    ##<
<br />&copy;全世界的人都知道    ##@
</body>
</html>

在这里插入图片描述

二、Web概述

1、 概述

Web (World wide Web)即全球广域网,也称为万维网
一种分布式图形信息系统
建立在Internet上的一种网络服务

2、Web1.0 vs Web2.0

  1. Web1. 0
    以编辑为特征,网站提供给用户的内容是编辑处理后的,然后用户阅读网站提供的内容
    这个过程是网站到用户的单向行为(静态页面的概念)
  2. Web2. 0
    更注重用户的交互作用,用户既是网站内容的消费者(浏览者),也是网站内容的制造者
    加强了网站与用户之间的互动,网站内容基于用户提供,网站的诸多功能也由用户参与建设,实现了网站与用户双向的交流与参
  3. Web2.0特征
    用户分享、以兴趣为聚合点的社群、开放的平台,活跃的用户

3、静态页面

3.1、概念

  • 静态网页是标准的HTML文件,扩展名是.htm、 . html;例如文本、图像、声音、Flash动画、客户端脚本和ActiveX控件及Java小程序等;
  • 是网站建设的基础,早期网站一般都由静态网页制作
  • 没有后台数据库、不含程序和不可交互的网页
  • 相对更新起来比较麻烦,适用于一般更新较少的展示型网站

3.2、特点

  • 每个静态网页都有一个固定的URL, 且URL以.htm、 . html、 .shtml等常见形式为后缀,而不含有“?”
  • 网页内容一经发布到网站服务器.上,无论是否有用户访问,每个静态网页都是保存在网站服务器上的
  • 静态网页的内容相对稳定,容易被搜索引擎检索
  • 静态网页没有数据库的支持,在网站制作和维护方面工作量较大,因此当网站信息量很大时完全依靠静态网页制作方式比较困难
  • 静态网页的交互性较差,在功能方面有较大的限制
  • 页面浏览速度迅速,过程无需连接数据库,开启页面速度快于动态页面

4、动态页面

4.1、概念

  • 网页URL不固定, 能通过后台与用户交互
  • 在动态网页网址中有一个标志性的符号一“?”
  • 常用的语言有PHP、JSP、 Python、 Ruby等

4.2、特点

  • 交互性
    网页会根据用户的要求和选择而动态改变和响应,将浏览器作为客户端界面
  • 自动更新
    无须手动地更新HTML文档,便会自动生成新的页面,可以大大节省工作量
  • 因时因人而变
    当不同的时间,不同的人访问同一网址时会产生不同的页面

三、HTTP协议

1、HTTP协议简介

  • HTTP ( 超文本传输协议HyperText TransferProtocol)协议是互联网上应用最为广泛的一种网络协议,它是基于TCP协议的应用层传输协议,简单来说就是客户端和服务端进行数据传输的一种规则
  • HTTP/HTTPS是应用层上的协议,建立在传输层TCP之上,客户端通过与服务端进行TCP连接(三次手握),之后发送HTTP请求与接收HTTP响应都是通过访问Socket接口来调用TCP协议实现。
  • HTTP 是一种无状态(stateless) 协议,HTTP协议本身不会对发送过的请求和相应的通信状态进行持久化处理。这样做的目的是为了保持HTTP协议的简单性,从而能够快速处理大量的事务,提高效率

然而,在许多应用场景中,我们需要保持用户登录的状态或记录用户购物车中的商品。由于HTTP是无状态协议,所以必须引入一些技术来记录管理状态,例如Cookie

cookie和session都为了实现的是http的短期的持久化(内存/缓存方式,查询快、效率比较高)
cookie
是缓存在用户端(client)浏览器中的(默认缓存一天),当下次客户端通过同一个浏览器访问客户端的时候,会优先读取cookie中的缓存信息,向服务端进行请求,同时服务端收到客户端请求的时候,读取到cookie文件,知道客户端之前找的是服务器A处理的任务,为了省事儿,省资源,干脆直接讲请求直接再交给服务器A处理

两者对比:
cookie 省服务器性能
session 更安全
1、为后面服务、集群、功能优化做铺垫
2、具体解释了怎么解决HTTP无状态协议的持久化/存储

2、HTTP协议的版本

  • HTTP 0.9;此版本已过时
  • HTTP 1.0
  • HTTP 1.1
  • HTTP 2.0

3、HTTP1.0和HTTP1.1之间的区别

  1. 缓存处理
    HTTP1.0中主要使用header里的If-Modified-Since,Expires来做为缓存判断的标准
    HTTP1.1则引入了更多的缓存控制策略例如Entity tag,If-Unmodified-Since, If-Match, If-None-Match等更多可供选择的缓存头来控制缓存策略,缓存处理的控制力更为强大
  2. 带宽优化及网络连接的使用;1.1比1.0节省带宽
    HTTP1.0中,存在一些浪费带宽的现象,例如客户端只是需要某个对象的一部分,而服务器却将整个对象送过来了,并且不支持断点续传功能
    HTTP1.1则在请求头引入了range(范围)头域,它允许只请求资源的某个部分,即返回码是206(Partial Content),这样就方便了开发者自由的选择以便于充分利用带宽和连接
  3. 错误通知的管理
    在HTTP1.1中新增了24个错误状态响应码
    如409(Conflict)表示请求的资源与资源的当前状态发生冲突
    410(Gone)表示服务器上的某个资源被永久性的删除
  4. Host头处理
    在HTTP1.0中认为每台服务器都绑定一个唯一的IP地址,因此,请求消息中的URL并没有传递主机名(hostname)。但随着虚拟主机技术的发展,在一台物理服务器上可以存在多个虚拟主机(Multi-homed Web Servers),并且它们共享一个IP地址。HTTP1.1的请求消息和响应消息都应支持Host头域,且请求消息中如果没有Host头域会报告一个错误(400 Bad Request)
  5. 长连接;1.0只能一次性的联系,1.1支持保持活跃状态的连接方式,即长链接
    HTTP 1.1支持长连接(PersistentConnection)和请求的流水线(Pipelining)处理,在一个TCP连接上可以传送多个HTTP请求和响应,减少了建立和关闭连接的消耗和延迟,在HTTP1.1中默认开启Connection(保持): keep-alive(存活),一定程度上弥补了HTTP1.0每次请求都要创建连接的缺点

4、HTTP方法

HTTP协议有多种获得Web资源的方法,常用方法是GET和POST

  • GET:请求获取Request-URI所标识的资源;新的资源是追加
  • POST:请求服务器删除Request-URI所标识的资源;新的资源会覆盖掉原先的

这里说明一下ERI和URL的区别
URI:确定的是对象是主体,标识的是唯一的身份
URL:标识具体所在的位置

4.1、GET方式

  • 请求行
    • 请求的方式
    • 请求的资源路径
    • 请求的版本协议号
    • 请求头(描述信息/标准化信息)
    • Accept:客户端可以接受的数据类型
    • Accept-Language:客户端可以接受的语言类型
    • User-Agent:浏览器的信息
    • Accpect-Encoding:客户端可以接受的编码格式
    • Host:表示请求的ip和端口号
    • Connection:告诉服务器请求连接如何处理
      - Keep-Alive:通知服务器回传数据不要马上关闭,保持一-小段的连接
      - Closed:马上关闭

4.2、POST请求方式

  • 请求行
    • 请求的方式
    • 请求的资源路径
    • 请求的协议的版本号
  • 请求头
    • Accept:客户端可以接受的数据类型
    • Accept-Language:客户端可以接受的语言类型.
    • Referer:表示请求发起时,浏览器地址栏中的地址
    • User-Agent:浏览器的信息
    • Content - Type:发送的数据类型
    • Content-Length:发送的数据长度
  • 请求体
    • 就是发送给服务器的数据

这里提一个面试题:GET 与POST 区别
① 区别一:语义上的区别
Get向服务器请求数据,依照HTTP协议,get 是用来请求数据。
Post向服务器发数据,依照HTTP协议,Post的语义是向服务器添加数据,也就是说按照Post的语义,该操作是会修改
服务器上的数据

② 区别二:服务器请求的区别
Get请求是可以被缓存,示例:
访问百度,访问的方式就是GET,此时访问后的内容会缓被存在浏览器中,短时间再次访问,其实是拿到的浏览器中的缓存内容另外Get请求只能接收ASCII码的回复
Post请求是不可以被缓存的。对于Post方式提交表单,刷新页面浏览器会弹出提示框“是否重新提交表单”,
Post可以接收二进制等各种数据形式,所以如果要上传文件一般用Post请求

③ 区别三:参数放请求头和请求体的差别
Get请求通常没有请求体(当然这也是可以由程序猿心情改变的),在TCP传输中只需传输一次(而不是一个包),所以Get请求效率相对高。
Post请求将数据放在请求体中,而实际传输中,会先传输完请求头,再传输请求体,是分为两次传输的(而不是两个包)。
Post请求头会比Get更小(一般不带参数),请求头更容易在一个TCP包中完成传输,更何况请求头中有Content-Length的标识,可以更好地保证Http包的完整性。

5、HTTP状态码

当使用浏览器访问某–个URL,会根据处理情况返回相应的处理状态
通常正常的状态码为2xx,3xx (如200 ok)
如果出现异常会返回4xx,5xx(如404)

状态码首位已定义范围分类
1 XX100-101信息提示
2xx200-206成功
3xx300-305重定向/页面跳转
4xx400-415客户端错误
5xx500-505服务器错误

生产环境常见的HTTP状态码

消息描述
200ok 请求成功( 其后是对GET和POST请求的应答文档)
301Moved Permanently 请求的永久页面跳转
404Not Found 服务器无法找到被请求的页面
500Internal Server Error 内部服务器错误
502Bad Gateway 无效网关
503Service Unavailable 当前服务不可用
504Gateway Timeout 网关请求超时

四、SSL握手

1、SSL握手过程

证书主要作用是在SSL握手中,我们来看一下SSL的握手过程

  • 客户端提交https请求
  • 服务器响应客户,并把证书公钥发给客户端
  • 客户端验证证书公钥的有效性
  • 有效后,会生成一个会话密钥
  • 用证书公钥加密这个会话密钥后,发送给服务器
  • 服务器收到公钥加密的会话密钥后,用私钥解密,回去会话密钥
  • 客户端与服务器双方利用这个会话密钥加密要传输的数据进行通信

2、SSL证书作用

https 起到了以下几个作用

  • 帮助客户端对服务器身份进行验证
  • 让需要传输的数据加密化
  • 验证传输的数据是否完整
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值