Web基础与HTTP协议

最新推荐文章于 2023-01-09 18:39:43 发布

云归有鹤

最新推荐文章于 2023-01-09 18:39:43 发布

阅读量577

点赞数

文章标签： http 网络协议网络

本文链接：https://blog.csdn.net/weixin_67474417/article/details/124820028

版权

本文深入介绍了Web基础知识，包括DNS的三种解析方式（/etc/hosts、/etc/resolv.conf、网卡配置文件）、域名空间结构与注册流程、HTTP协议的版本和请求格式，以及静态与动态网页的区别。此外，还讲解了HTTP状态码和Web1.0与Web2.0的对比，是理解互联网工作原理的绝佳教程。

摘要由CSDN通过智能技术生成

前言：主播已经好的差不多啦，这章我们来看一下web的基础知识，其中包含了域名的概念，DNS的原理等一系列相关知识，希望拐友们能够好好看

4.2.2HTML文档的结构（HTML网页）

1.DNS与域名

1.1域名和IP地址的介绍

网络上交互是基于TCP/IP协议的，每个主机在逻辑上有一个唯一位置标识（地址)，物理地址为NAC地址

为了保证地址唯一性，用户协议向特地的机构申请注册，分配IP地址网络中的地址有两套方案: IP地址系统、域名地址系统

而由于IP是由32位二进制数字标识，不方便记忆，所以、以IP地址为基础发展出了符号化地址来代替解决方案，也是是域名

ps：固定的IP地址是逻辑地址

2.DNS的三种解析方式

2.1./etc/hosts

linux系统中负责快速解析的文件，包含了ip与主机名的映射关系，在没有DNS服务器的情况下，使用本地/etc/hosts完成解析/映射，实现快速访问
Ps:主要用于主机之间（IP和主机名）的映射/解析关系，示例:192.168.226.128 master
192.168.226.129 node1
192.168.226.130 node2

2.2/etc/resolv.conf

DNS客户端配置文件，主要用于设置DNS服务器的P和域名，还包含了主机域名的搜索顺序等等，这个文件是由域名解析器(resolver，一个根据主机名解析IP地址的库）使用的配置文件。
PS:主要用与匹配DNS服务器，示例:

nameserver 218.2.135.1（这里指南京的DNS）
nameserver 114.114.114.114（这里指电信的DNS）
nameserver 8.8.8.8(这里指谷歌的DNS)

2.3在网卡配置文件中定义

/etc/ sysconfig/ network-scripts/ifcfg-ens33（直接在网卡设置面种定义）
DNS1=114.114.114.114
DNS2=8.8.8.8

ps：★生效顺序：1 hosts文件 ▶▶▶ 2网卡配置文件 ▶▶▶3 /etc/resolv.conf

3.域名服务和域名注册

3.1域名空间结构

根域位于域名空间最顶层，一般用一个"." 表示基础单位，除了根域其他都只有一个上级域，有o或多个子域，同层域不可重复的子域或域名
顶级域 一般代表一种类型的组织机构或国家地区（主要有此两种类型构成），如net（网络公司），com（商业），org（民间团体组织），edu（教育），gov（政府），mil（军事），cn（中国），jp（日本），hk（中国香港）
二级域（如www.taobao.com）也叫子域用来标明顶级域内的一个特定的组织，国家顶级域下面的二级域名由国家网络部门统一管理，如 .cn顶级域名下面设置的二级域名: .com.cn、.net.cn、 .edu.cn …
子域用来标明顶级域内的一个特定的组织，国家顶级域下面的二级域名由国家网络部门统一管理，如 .cn顶级域名下面设置的二级域名: .com.cn、.net.cn、 .edu.cn …
主机主机位于域名空间最下层，就是一台具体的计算机，如www、mail、都是具体的计算机名字，可用www.sina.com.cn.、mail.sina.com.cn、来表示，这种表示方式称为FQDN(完全合格域名)，也是这台主机在域名中的全名

3.2域名注册

域名注册是Internet中用于解决地址对应问题的一种方法，遵循先申请先注册原则
域名注册步骤：
1.准备申请资料 2.寻找域名注册网站 3.查询域名 4.正式申请 5.申请成功

3.3域名服务

分布式：把一个整体的文件若干个分给其他的机器
层次性：类似dns，比如根域，顶级域，二级域这样一层一层下来

4.网页（HTTP/HTTPS）

4.1网页基本概念

纯文本格式文件
编写语言为HTML
在用户的浏览器种被“翻译”成网页形式显示出来

网站	由一个一个页面构成的，是多个网页的结合体
主页	打开网站后出现的第一个网页称为网站主页（或首页）
域名	浏览网页时输入的网址
HTTP	用来传输网页的通信协议
URL	是一种万维网寻址系统
HTML	用来编写网页的超文本标记语言
超链接	超链接是将网站种不同网页链接起来的功能
发布	将制作好的网页上传到服务器供用户访问的过程

思路图

当用户写一个页面去访问时，浏览器会测试是否符合要求，如果符合那就提供服务，如果不符合就拒绝服务或报错，并返回给用户。

4.2HTML文档的结构

4.2.1HTML超文本标记语言

Hyper Text Markup Language
网页的"源码"

4.2.2HTML文档的结构（HTML网页）

头部部分
标题部分
主体部分
网页内容，包括文本，图像等

4.2.3网页摘要信息的作用

有利于浏览器的解析
有利于搜索引擎搜索

4.2.4网页基本标签

标题标签
行控制相关标签
范围标签
图像标签
超链接标签
特殊符号

5.Web

5.1.Web概述

Webworld wide web)即全球广域网，也称为万维网
一种分布式图形信息系统
建立在Internet上的一种网络服务

5.2.web1.0与web2.0的区别

web1.0

以编辑为特征，网站提供给用户的内容是编辑处理后的，然后用户阅读网站提供的内容这个过程是网站到用户的单向行为（静态页面的概念）

web2.0

更注重用户的交互作用，用户既是网站内容的消费者（浏览者)，也是网站内容的制造者
加强了网站与用户之间的互动，网站内容基于用户提供，网站的诸多功能也由用户参与建设，实现了网站与用户双向的交流和参与

web2.0特征

用户分享、以兴趣为聚合点的社群、开放的平台，活跃的用户

简单来说web1时单向的，只能编辑，不能交互

web2可以交互

6.静态网页和动态网页

6.1静态网页的定义

静态网页是标准的HTML文件扩展名是.htm .html
例如文本、图像、声音、Flash动画、客户端脚本和Activex控件及Java小程序等
是网站建设的基础，早期网站一般都由静态网页制作
没有后台数据库、不含程序和不可交互的网页
相对更新起来比较麻烦，适用于一般更新较少的展示型网站

6.2静态网页的特点

每个静态网页都有一个固定的URL，且URL以.htm、.html、.shtml等常见形式为后缀，而不含有"?"
网页内容一经发布到网站服务器上，无论是否有用户访问，每个静态网页都是保存在网站服务器上的
静态网页的内容相对稳定，容易被搜索引擎检索
静态网页没有数据库的支持，在网站制作和维护方面工作量较大，因此当网站信息量很大时完全依靠静态网页制作方式比较困难
静态网页的交互性较差，在功能方面有较大的限制
页面浏览速度迅速，过程无需连接数据库，开启页面速度快于动态页面

6.3动态网页

网页URL不固定，能通过后台与用户交互,在动态网页网址中有一个标志性的符号——"?"
常用的语言有PHP、JSP、Python、Ruby等（其中PHP、JSP、Python用的比较多）

6.4动态页面特点

交互性

网页会根据用户的要求和选择而动态改变和响应，将浏览器作为客户端界面，这将是今后 wBB发展的大势所趋

自动更新

无须手动地更新HTML文档，便会自动生成新的页面，可以大大节省工作量

因时因人而变

当不同的时间，不同的人访问同一网址时会产生不同的页面

7.HTTP协议概述

7.1HTTP协议简介

HTTP协议是互联网上应用最为广泛的一种网络协议,设计这个协议的目的是为了发布和接收Web服务器上的HTML页面。它是基于TCP协议的应用层传输协议，简单来说就是客户端和服务端进行数据传输的一种规则。
HTTP/HTTPS是应用层上的协议，建立在传输层TCP之上，客户端通过与服务端进行TCP连接（三次握手），之后发送HTTP请求与接受HTTP相应都是通过访问Socket接口来调用TCP协议实现。
HTTP是一种无状态协议HTTP协议本身不会对发送过的请求和相应的通信状态进行持久化处理（存储，保存）。这样做的目的是为了保持HTTP协议的简单性，从而能够快速处理大量的事务, 提高效率。然而，在许多应用场景中，我们需要保持用户登录的状态或记录用户购物车中的商品。由于HTTP是无状态协议，所以必须引入一些技术来记录管理状态，例如Cookie。
cookie和session都为了实现的是http的短期的持久化(内存/缓存方式，查询快、效率比较高)，cookie是缓存在用户端（client)浏览器中的（默认缓存一天），当下次客户端通过同一个浏览器访问客户端的时候，会优先读取cookie中的缓存信息，向服务端进行请求，同时服务端收到客户端请求的时候，读取到cookie文件，知道客户端之前找的是服务器A处理的任务，为了省事儿，省资源，干脆直接讲请求直接再交给服务器A处理。

ps：cookie 省服务器性能

session 更安全

7.2HTTP协议的版本

HTTP/0.9：已过时
HTTP/1.0：完善的请求，相应模型并且协议补充（完整） get post head方法
HTTP/1.1：现在1.0基础上进行更新，新增五种请求方式：OPTIONS PUT DELETE TRACE CONNECT
HTTP/2.0：

7.3HTTP请求格式

7.3.1GET方式（请求行）

请求的方式
请求的资源路径
请求的版本协议号

7.3.2请求头（描述信息/标准化信息）

Accept	客户端可以接受的数据类型
Accept-Language	客户端可以接受的语言类型
User-Agent	浏览器的信息
Accpect-Encoding	客户端可以接受的编码格式
Host	表示请求的ip和端口号
Connection	告诉服务器请求连接如何处理
Keep-Alive	通知服务器回传数据不要马上关闭，保持一小段的连接
Closed	马上关闭

7.3.3POST 请求方式（请求行）

请求的方式
请求的资源路径
请求的协议的版本号

7.3.4请求头

Accept	客户端可以接受的数据类型
Accept-Language	客户端可以接受的语言类型
Referer	表示请求发起时，浏览器地址栏中的地址
User-Agent	浏览器的信息
Content-Type	发送的数据类型
Content-Length	发送的数据长度

请求体：就是发送给服务器的数据

7.4GET与POST的区别

1.语义上的区别

1.Get向服务器请求数据，依照HTTP协议，get 是用来请求数据。

2.Post向服务器发数据，依照HTTP协议，Post的语义是向服务器添加数据，也就是说按照Post的语

义，该操作是会修改服务器上的数据

2.服务器请求的区别

1.Get请求是可以被缓存，示例：访问百度，访问的方式就是GET，此时访问后的内容会缓被存在浏览器中，短时间再次访问，其实是拿到的浏览器中的缓存内容

另外Get请求只能接收ASCII码的回复

2.Post请求是不可以被缓存的。对于Post方式提交表单，刷新页面浏览器会弹出提示框“是否重新提交表单”，Post可以接收二进制等各种数据形式，所以如果要上传文件一般用Post请求

3.参数放请求头和请求体的差别

1.Get请求通常没有请求体（当然这也是可以由程序猿心情改变的），在TCP传输中只需传输一次（而不是一个包），所以Get请求效率相对高。

2.Post请求将数据放在请求体中，而实际传输中，会先传输完请求头，再传输请求体，是分为两次传输的（而不是两个包）。Post请求头会比Get更小（一般不带参数），请求头更容易在一个TCP包中完成传输，更何况请求头中有Content-Length的标识，可以更好地保证Http包的完整性。

4.简单的理解：

GET方法：
从指定的服务器上获得数据
GET请求能被缓存
GET请求会保存在浏览器的浏览记录里
GET请求有长度的限制
主要用于获取数据
查询的字符串会显示在URL中，不安全

POST方法：
提交数据给指定服务器处理
POST请求不能被缓存
POST请求不会保存在浏览器的浏览记录里
POST请求没有长度限制
查询的字符串不会显示在URL中，比较安全

八.HTTP状态码

状态码首位	已定义范围	分类
1xx	100-101	信息提示
2xx	200-206	成功
3xx	300-305	重定向
4xx	400-415	客户端错误
5xx	500-505	服务器错误

8.1生产环境常见的HTTP状态码

消息	描述
200 OK	请求成功（其后是对GET和POST请求的应答文档）
301 Moved Permanently	请求的永久页面跳转
403 Forbidden	禁止访问该页面
404 Not Found	服务器无法找到被请求的页面
500 Internal Server Error	内部服务器错误
502 Bad Gateway	无效网关
503 Service Unavailable	当前服务不可用
504 Gateway Timeout	网关请求超时

8.2HTTP请求流程

用户在浏览器输入URL访问时，发起HTTP请求报文，请求中包括请求行、请求头、请求体，服务器收到请求后返回响应报文，包括状态行、响应头、响应体。

详细版：

客户端解析到IP地址后会通过TCP的三次握手与服务器建立连接，首先客户端向服务器发送请求连接报文，SYN=1初始序号seq为x，这时客户端进入SYN-SENT状态，服务器确认请求报文ACK=1,SYN=1,确认序号ACK=X+1，服务器产生的初始序号seq=y，回复客户端确认连接，此时服务器进入SYN-RCVD状态，客户端接受后确认报文ACK=1,ACK=y+1，客户端又重组序号为x+1。TCP连接已经建立，客户端进入ESTABLISHED 状态，当服务器收到客户端的确认后，也会进入 ESTABLISHED 状态。客户端连接到IP地址，发送httpGET的请求，从服务器读取http响应。

之后断开连接时，需要通过TCP的四次挥手完成，客户端向服务器发送断开连接请求报文，FIN=1,ACK=1,序号为u,客户端处于FIN—WAIT-1（终止等待1）状态，服务器确认报文ACK=1,确认序号为ACK=u+1,服务器的序号为v,回复客户端，服务器服务端处于CLOSE—WAIT（关闭等待）状态，客户端接受确认报文ACK=1,确认序号ACK=v+1,客户端重组序号为seq=u+1，客户端处于FIN—WAIT-2（终止等待2）状态，然后服务器也想让客户端断开连接，就发送了断开连接请求，FIN=1，ACK=1,服务器重组序号为w,服务器服务端处于LAST—ACK（最后确认）状态，客户端接受后确认报文ACK=1.确认序号为ACK=w+1,客户端序号为u+1，客户端进入CLOSED（时间等待）状态，等待最长报文段寿命2*MSL,服务器确认后，立即进入关闭状态。然后进行关闭连接。

9.总结

1.域名空间结构

2.HTML文档结构

3.网页基本标签

4.Web1.0和Web2.0区别

5.post和get方法区别

6.HTTP协议报文格式

云归有鹤

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Web基础与HTTP协议

前言：主播已经好的差不多啦，这章我们来看一下web的基础知识，其中包含了域名的概念，DNS的原理等一系列相关知识，希望拐友们能够好好看目录1.DNS与域名1.1域名和IP地址的介绍2.DNS的三种解析方式2.1./etc/hosts2.2/etc/resolv.conf2.3在网卡配置文件中定义3.域名服务和域名注册3.1域名空间结构3.2域名注册 3.3域名服务4.网页（HTTP/HTTPS）4.1网页基本概念4.2HTML文档的结构...
复制链接

扫一扫