Web基础与HTTP协议

Web基础与HTTP协议

1Web基础

1.1域名的概念

网络是基于TCP/IP协议进行通信和连接的,每一台主机都有一个唯一的标识(固定的IP地址),用以区别在网络上成千上万个用户和计算机。网络在区分所有与之相连的网络和主机时,均采用一种唯一、通用的地址格式,即每一个与网络相连接的计算机和服务器都被指派了一个独一无二的地址。

由于IP地址是数字标识,使用时难以记忆和书写,因此就有了域名,域名可以有助于我们记忆。并且有层次性。所以在网络中有两套方案。 ①ip地址系统 ②域名地址系统

域名的概念

IP地址相对应的字符型地址,就是域名。

早期使用Hosts文件解析域名难点

主机名称重复

主机维护困难

DNS(Domain Name System 域名系统)

分布式: 将一块整体分成若干个小部分进行处理。(将一台DNS服务器分成其它服务器,每个服务器维护一小块部分)

层次性: 将域名服务器分成各个服务器(根域、顶级域、二级域、主机域)

DNS解析方式,总共有三种

生效顺序:/etc/hosts 文件 ---->网卡配置文件-----> /etc/resolv.conf 文件

1./etc/hosts
Hosts 文件是一个用于存储计算机网络中节点信息的文件,可以将主机名映射到相应的 IP 地址,实现 DNS 的功能,可以由计算机的用户进行修改控制。

2./etc/resolv.conf
DNS客户端配置文件,主要用于设置DNS服务器的iP和域名,还包含了主机域名的搜索顺序等等,
这个文件是由域名解析器(resolver,一个根据主机名解析IP地址的库)使用的配置文件。

域名空间结构

根域: 位于域名空间的最顶层,一般用一个“ . ” 表示,

顶级域: 一般代表一种类型的组织机构或国家地区。例如:(net网络公司),(com商业公司)(cn中国)

二级域: 用来标明顶级域内的一个特定的组织,国家顶级域下面的二级域名由国家网络部门统一管理,如(.com.cn)(.net.cn)(.edu.cn)

子域: 二级域下所创建的各级域统称子域,各个组织域或用户可以自由申请注册自己的域名

主机名: 主机位于域名空间的最下层,就是一台具体的计算机,如:www、mail、都是具体的计算机名字,可以用www.sina.com.cn 来表示这种方式成为 FQDN(完全合格域名) ,也是这台主机在域名中的全名。

1.2bond网卡

将多个物理网卡集合成一块虚拟网卡,这块虚拟网卡就叫bond网卡。可以起到冗余备份作用,当有一个物理网卡损坏时,可以虚拟网卡可以通过另一块物理网卡进行传输数据。

1.3域名的申请注册

域名注册是internet中用于解决地址对应问题的一种方法

遵循现申请先注册原则

域名注册步骤:主备申请资料—>寻找域名注册网站----->查询域名是否被注册(被注册就换一个)---->申请注册----->s申请成功

2网页访问

网页

纯文本格式文件
编写语言为HTML
在用户的浏览器中被“翻译”成网页形式显示出来
网站

由一个一个页面构成的,是多个网页的结合体
主页

打开网站后出现的第一个网页称为网站主页(或首页)
域名

浏览网页时输入的网页
HTTP(端口:80) / HTTPS(加密|端口:443)

用来传输网页的通信协议
URL

是一种万维网地址系统,就是一条完整的地址,包括HTTP协议/HTTPD协议,加上后面域名
HTML

用来编写网页的超文本标记语言
超链接

是将网站中不同网页链接起来的功能
发布

将制作好的网页上传到服务器供用户访问的过程

3HTML介绍

超文本标记语言(Hyper Text Markup Language),网页的“源码”。

浏览器的作用: ”解释和执行“HTML源码的工具

3.1 HTML 文档的结构

HTML网页

  • 头部部分
  • 标题部分
  • 主题部分
  • 网页内容,包括文本、图像等

简单尝试一下HTML语言

首先安装httpd服务,在/var/www/html/目录下面可以进行创建文件,文件名需要以htm或html为后缀名。在这些文件中,进行编辑html语言

<html>

<head>


<title>我的第一个网页 </title>

</head>

<body >
    Hello World!
</body>

</html>

4Web概述

  • Web(world wide web) 即全球广域网,也称万维网
  • 一种分布式图形信息系统
  • 建立在internet上的一种网络服务

4.1.Web1.0 和 Web 2.0 的区别

Web 1.0

以编辑为特征,网站提供给用户的内容时编辑处理后的,然后用户阅读网站提供的内容

这个过程是网站到用户的单向行为

Web 2.0

更注重用户的交互作用,用户既是网站内容的消费者(浏览者),也是网站内容的制造者。
加强了网站与用户之间的互动,网站内容基于用户提供,网站的诸多功能也由用户参与建设,实现了网站与用户双向的交流与参与
Web2.0 特征:用户分享、以兴趣为聚合点的社区,开放的平台,活跃的用户

4.2静态网页和动态网页

4.2.1静态网页

概述

  • 静态网页是标准的HTML文件
  • 扩展是 .htm 、.html
  • 是网站建设的基础,早期网站一般都是由静态网页制作
  • 没有后台数据库,不含程序和不可交互的网页
  • 相对更新起来比较麻烦,适用于一般更新较少的展示型网站

特点

每个静态网页都有一个固定的URL,且URL以.htm 、.html 、.shtml 等常见形式为后缀,而不含有 “ ?”(问号表示动态页面)

网页内容一经发布到网站服务器上,无论是否有用户访问,每个静态网页都是保存在网站服务器上的

静态网页的内容相对稳定,容易被搜索引擎检索

静态网页没有数据库的支持,在网站制作和维护方面工作量较大,因此当网站信息量很大时,完全依靠静态网页方式比较困难

静态网页的交互性较差,在功能方面有较大的限制

页面浏览速度迅速,过程无需连接数据库,开启页面速度快于动态页面

4.2.2动态网页

概述

网页IURL不固定,能通过后台与用户交互
在动态网页网址中有一个标志性的符号----“ ?”
常用的语言有PHP、JSP、Python、Ruby等
特点

①交互性: 网页会根据用户的要求和选择而改变和响应,将浏览器作为客户端界面,这将是今后Web发展的大势所趋。

②自动更新: 无需手动地更新HTML文档,变回自动生成新的页面,可以大大节省工作量。

③因时因人而变: 当不同的时间,不同的人访问同一网址时会产生不同的页面

5HTTP协议概述

HTTP协议是互联网上应用最为广泛的一种网络协议,设计这个协议的目的是为了发布和接收Web服务器上的HTML页面

HTTP协议的版本

  • HTTP 0.9 (淘汰)
  • HTTP 1.0
  • HTTP 1.1
  • HTTP 2.0(使用不普遍)

5.1HTTP协议简介

HTTP(超文本传输协议HyperText TransferProtocol)协议 是互联网上应用最为广泛的一种网络协议,它是基于TCP协议的应用层传输协议,简单来说就是客户端和服务端进行数据传输的一种规则。

HTTP/HTTPS是应用层上的协议 ,建立在传输层TCP之上,客户端通过与服务端进行TCP连接(三次握手),之后发送HTTP请求与接收HTTP响应都是通过访问Socket接口来调用TCP协议实现

**HTTP 是一种无状态 (stateless) 协议 .**HTTP协议本身不会对发送过的请求和相应的通信状态进行持久化处理(存储,保存)。这样做的目的是为了保持HTTP协议的简单性,从而能够快速处理大量的事务,提高效率。然而,在许多应用场景中,我们需要保持用户登录的状态或记录用户购物车中的商品。由于HTTP是无状态协议,所以必须引入一些技术来记录管理状态,例如Cookie。

cookie和session都为了实现的是http的短期的持久化 (内存/缓存方式,查询快、效率比较高),cookie是缓存在用户端(client)浏览器中的(默认缓存一天), 当下次客户端通过同一个浏览器访问客户端的时候,会优先读取cookie中的缓存信息 ,向服务端进行请求,同时服务端收到客户端请求的时候,读取到cookie文件,知道客户端之前找的是服务器A处理的任务,为了省事儿,省资源,干脆直接讲请求直接再交给服务器A处理。

5.2HTTP1.0 和HTTP 1.1 之间的区别

5.2.1缓存处理

在HTTP1.0中主要使用header里的If-Modified-Since,Expires来做为缓存判断的标准,HTTP1.1则引入了更多的缓存控制策略例如Entity tag,If-Unmodified-Since, If-Match, If-None-Match等更多可供选择的缓存头来控制缓存策略。

1.1 比1.0 在缓存上增加了很多功能

5.2.2带宽优化及网络连接的使用

HTTP1.0中,存在一些浪费带宽的现象,例如:客户端只是需要某个对象的一部分,而服务器却将整个对象送过来了,并且不支持断点续传功能,

HTTP1.1则在请求头引入了range头域,它允许只请求资源的某个部分,即返回码是206(Partial Content),这样就方便了开发者自由的选择以便于充分利用带宽和连接

1.0会浪费资源带宽,2.0可以充分利用带宽

5.2.3错误通知的管理

在HTTP1.1中新增了24个错误状态响应码,如409(Conflict)表示请求的资源与资源的当前状态发生冲突;410(Gone)表示服务器上的某个资源被永久性的删除

5.2.4 Host头处理

在HTTP1.0中认为每台服务器都绑定一个唯一的IP地址,因此,请求消息中的URL并没有传递主机名(hostname)。但随着虚拟主机技术的发展,在一台物理服务器上可以存在多个虚拟主机(Multi-homed Web Servers),并且它们共享一个IP地址。HTTP1.1的请求消息和响应消息都应支持Host头域,且请求消息中如果没有Host头域会报告一个错误(400 Bad Request)

5.2.5长连接

HTTP 1.1支持长连接(PersistentConnection)和请求的流水线(Pipelining)处理,在一个TCP连接上可以传送多个HTTP请求和响应,减少了建立和关闭连接的消耗和延迟,在HTTP1.1中默认开启Connection: keep-alive,一定程度上弥补了HTTP1.0每次请求都要创建连接的缺点。
1.0只能一次性连接。1.1支持保持活跃状态的连接方式,即长链接5.3

5.3HTTP 请求格式(GET/POST方式)

HTTP协议有多种获得Web资源的方法

http方法	描述
GET	请求获取Request-URL所标识的资源
PUT	请求服务器存储一个资源,并用Request-URL作为其标识
DELETE	请求服务器删除Request-URL所标识的资源
POST	在Request-URL所标识的资源后附加新的数据
HEAD	请求获取由Request-URL所标识的资源的响应消息报头

5.3.1 GET方式

请求行

  • 请求的方式

  • 请求的资源路径

  • 请求的版本协议号

    请求头

Accept:客户端可以接受的数据类型

Accept-Language:客户端可以接受的语言类型

User-Agent:浏览器的信息

Accpect-Encoding:客户端可以接受的编码格式

Host:表示请求的ip和端口号

Connection:告诉服务器请求连接如何处理

Keep-Alive:通知服务器回传数据不要马上关闭,保持一小段的连接

Closed:马上关闭
5.3.2POST 请求方式

请求行

  • 请求的方式
  • 请求的资源路径
  • 请求的协议的版本号

请求头

Accept:客户端可以接受的数据类型

Accept-Language:客户端可以接受的语言类型

Referer:表示请求发起时,浏览器地址栏中的地址

User-Agent:浏览器的信息

Content-Type:发送的数据类型

Content-Length:发送的数据长度

请求体

就是发送给服务器的数据

5.4GET 与POST区别

区别一 语义上的区别

Get向服务器请求数据,依照HTTP协议,get 是用来请求数据。

Post向服务器发数据,依照HTTP协议,Post的语义是向服务器添加数据,也就是说按照Post的语

义,该操作是会修改服务器上的数据

区别二 服务器请求的区别

Get请求是可以被缓存,示例:访问百度,访问的方式就是GET,此时访问后的内容会缓被存在浏览器中,短时间再次访问,其实是拿到的浏览器中的缓存内容

另外Get请求只能接收ASCII码的回复

Post请求是不可以被缓存的。对于Post方式提交表单,刷新页面浏览器会弹出提示框“是否重新提交表单”,Post可以接收二进制等各种数据形式,所以如果要上传文件一般用Post请求
区别 三 参数放请求头和请求体的差别

Get请求通常没有请求体(当然这也是可以由程序猿心情改变的),在TCP传输中只需传输一次(而不是一个包),
所以Get请求效率相对高。

Post请求将数据放在请求体中,而实际传输中,会先传输完请求头,再传输请求体,是分为两次传输的
(而不是两个包)。Post请求头会比Get更小(一般不带参数),请求头更容易在一个TCP包中完成传输,
更何况请求头中有Content-Length的标识,可以更好地保证Http包的完整性。

6常见的状态返回码

状态码首位已定义范围分类
1xx100-101信息提示
2xx200-206成功
3xx300-305重定向
4xx400-415客户端错误
5xx500-505服务器错误

生产常见的HTTP状态码

消息	描述
200 ok	请求成功(其后是对GET和POST请求的应答文档)
301 Moved Permanently	请求的永久页面跳转
403 Forbidden	禁止访问该页面
404 Not Found	 服务器无法找到被请求的页面
500 lnternal server error	内部服务器错误
502 Bad Gateway	无效网关
503 Service Unavailable	 当前服务不可用
504 Gateway Timeout 	 网关请求超时

7总结

DNS服务器作用

  • 就是域名解析

Web1.0和Web2.0区别

  • Web1.0 为静态页面,单向,不能交互,URL固定,不带 “ ?”
  • Web2.0为动态页面,双向,可以交互,URL不固定,带有 “ ?

HTTP1.0 和HTTP 1.1 之间的区别

GET 与POST区别

的永久页面跳转
403 Forbidden 禁止访问该页面
404 Not Found 服务器无法找到被请求的页面
500 lnternal server error 内部服务器错误
502 Bad Gateway 无效网关
503 Service Unavailable 当前服务不可用
504 Gateway Timeout 网关请求超时


## 7总结

**DNS服务器作用**

- 就是域名解析

**Web1.0和Web2.0区别**

- Web1.0 为静态页面,单向,不能交互,URL固定,不带 “ ?”
- Web2.0为动态页面,双向,可以交互,URL不固定,带有 “ ?

**HTTP1.0 和HTTP 1.1 之间的区别**

**GET 与POST区别**

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值