Web基础与HTTP协议

最新推荐文章于 2024-09-30 15:42:36 发布

茉璃珞

最新推荐文章于 2024-09-30 15:42:36 发布

阅读量117

点赞数

文章标签：前端 http 网络

本文链接：https://blog.csdn.net/weixin_51099370/article/details/124854235

版权

本文详细介绍了域名注册与服务、DNS解析的三种方式，包括本地hosts、网卡配置和resolv.conf，以及HTTP/HTTPS协议、Web1.0与Web2.0的区别，还有HTML基础和HTTP协议的工作原理。适合理解网页开发和技术架构的读者。

摘要由CSDN通过智能技术生成

前言

我们访问的网页会分为不同的类型，有的网页显示的内容比较单一，有的网页现实的内容可以是多变的，这也就是本文会介绍到的页面的问题，日常还有很多域名的问题等

一、DNS与域名

1、域名和IP地址简介

网络上交互是基于TCP/IP协议的，每个主机在逻辑上有一个唯一位置标识（地址)，物理地址为NAC地址。
为了保证地址唯一性，用户协议向特地的机构申请注册，分配IP地址网络中的地址有两套方案: IP地址系统、域名地址系统。
而由于IP是由32位二进制数字标识，不方便记忆，所以、以IP地址为基础发展出了符号化地址来代替解决方案，也是是域名。

2、阿里云域名申请

申请->查询重名-> (给钱20-60块) 备案->拍照（负责人拍照人）-> 等待10-20天申请之后就可以解析和使用（但是如果有问题会被封）

二、DNS解析的三种方式

1、/etc/hosts

linux系统中负责快速解析的文件，包含了ip与主机名的映射关系，在没有DNS服务器的情况下，使用本地/etc/hosts完成解析/映射，实现快速访问

注：主要用于主机之间（IP和主机名）的映射/解析关系，示例:

192.168.226.128 master
192.168.226.129 node1
192.168.226.130 node2

2、在网卡配置文件中定义

/etc/ sysconfig/ network-scripts/ifcfg-ens33
DNS1=114.114.114.114
DNS2=8.8.8.8

3、/etc/resolv.conf

DNS客户端配置文件，主要用于设置DNS服务器的P和域名，还包含了主机域名的搜索顺序等等，这个文件是由域名解析器(resolver，一个根据主机名解析IP地址的库）使用的配置文件。

PS:主要用与匹配DNS服务器，示例:

nameserver 114.114.114.114
nameserver 8.8.8.8

注意：读取顺序为hosts文件 -> 网卡配置文件 -> /etc/resolv.conf

三、域名服务与注册

1、域名

标识一组主机并提供它们的有关信息的树形结构（主要确定了根在哪，就可以确定每个分支)

根域：以".”为开始域名空间结构(从右往左看)根域位于域名空间最顶层，一般用一个".”表示。基础单位，除了根域其他都只有一个上级域，有o或多个子域，同层域不可重复的子域或域名

顶级域：一般代表一种类型的组织机构或国家地区（主要有此两种类型构成），如net（网络公司)、com（商业)、org(民间团体组织)、edu(教育)、gov(政府)、mil(军事)、cn(中国)、jp(日本)、hk(中国香港)

二级域：也叫子域用来标明顶级域内的一个特定的组织，国家顶级域下面的二级域名由国家网络部门统一管理，如 .cn顶级域名下面设置的二级域名: .com.cn、.net.cn、 .edu.cn …

主机：主机位于域名空间最下层，就是一台具体的计算机，如

www、mail、都是具体的计算机名字，可用www.sina.com.cn.、mail.sina.com.cn、来表示，这种表示方式称为FQDN(完全合格域名)，也是这台主机在域名中的全名

2、域名服务

分布式，每台主机维护一个部分,保持和维护域名空间的程序,响应解析器的请求

方向：解析端（客户端)向DNS服务器发出请求的设备

3、域名注册

域名注册是Internet中用于解决地址对应问题的一种方法遵循先申请先注册原则，注册步骤如下：
准备申请资料 -> 寻找域名注册网站 -> 查询域名 -> 正式申请 -> 申请成功

四、网页HTTP/HTTPS

1、网页基本概念

网页：纯文本格式文件，编写语言为HTML，在用户的浏览器中被“翻译”成网页形式显示出来
网站：由一个一个页面构成的，是多个网页的结合体
主页：打开网站后出现的第一个网页称为网站主页（或首页）
域名：浏览网页时输入的网址
HTTP/HTTPS：用来传输网页的通信协议（是否加密），是一种通讯/交互的标准/规范
URL：是一种万维网寻址系统
HTML：用来编写网页的超文本标记语言
超链接：超链接是将网站中不同网页链接起来的功能
发布：将制作好的网页上传到服务器供用户访问的过程

2、HTML概念

HTML超文本标记语言

Hyper Text Markup Language网页的“源码”
浏览器：“解释和执行”HTML源码的工具

HTML文档的结构

HTML网页
头部部分
标题部分
主体部分
网页内容（包括文本、图像等）

##示例：
<html>			
<head>
<title>标题 </title>
</head>
<body >
       Hello World!		#内容
</body>
</html>

标签	描述
title	定义了文档的标题
base	定义了页面链接标签的默认链接地址
link	定义了一个文档和外部资源之间的关系
meta	定义了 HTML 文档中的元数据
script	定义了客户端的脚本文件
style	定义了 HTML 文档的样式文件
table	定义一个表格
tr	定义了表格中的一行
td	定义了表格中某一行的一列
img	定义了一个图像
a	定义了一个超链接
p	定义了一行
br	定义了换行
font	定义了字体

网页基本标签

网页摘要信息的作用

有利于浏览器解析
有利于搜索引擎搜索
<title>标签 #标题
<meta>标签 #元标志

标题标签类型：

	行控制相关标签
	范围标签
	图像标签
	超链接标签
	特殊符号

五、Web概述

Web（World Wide Web）即全球广域网，也称为万维网，是一种分布式图形信息系统，建立在Internet上的一种网络服务

1、Web1.0与Web2.0

Web1.0

以编辑为特征，网站提供给用户的内容是编辑处理后的，然后用户阅读网站提供的内容，这个过程是网站到用户的单向行为

Web2.0

更注重用户的交互作用，用户既是网站内容的消费者（浏览者），也是网站内容的制造者，加强了网站与用户之间的互动，网站内容基于用户提供，网站的诸多功能也由用户参与建设，实现了网站与用户双向的交流与参与

Web2.0特征：用户分享、以兴趣为聚合点的社群、开放的平台，活跃的用户

2、静态页面与动态页面

静态页面

静态网页是标准的HTML文件扩展名是.htm .html
例如：文本、图像、声音、Flash动画、客户端脚本和Activex控件及Java小程序等
是网站建设的基础，早期网站一般都由静态网页制作，没有后台数据库、不含程序和不可交互的网页，相对更新起来比较麻烦，适用于一般更新较少的展示型网站
特点：
每个静态网页都有一个固定的URL，且URL以.htm、.html、.shtml等常见形式为后缀，而不含有"?"
网页内容一经发布到网站服务器上，无论是否有用户访问，每个静态网页都是保存在网站服务器上的静态网页的内容相对稳定，容易被搜索引擎检索，静态网页没有数据库的支持，在网站制作和维护方面工作量较大，因此当网站信息量很大时完全依靠静态网页制作方式比较困难，静态网页的交互性较差，在功能方面有较大的限制。页面浏览速度迅速，过程无需连接数据库，开启页面速度快于动态页面

动态页面

网页URL不固定，能通过后台与用户交互,在动态网页网址中有一个标志性的符号——“?”
常用的语言有PHP、JSP、Python、Ruby等
特点：

交互性
网页会根据用户的要求和选择而动态改变和响应，将浏览器作为客户端界面，这将是今后wBB发展的大势所趋
自动更新
无须手动地更新HTML文档，便会自动生成新的页面，可以大大节省工作量
因时因人而变
当不同的时间，不同的人访问同一网址时会产生不同的页面

六、HTTP协议概述

1、HTTP协议简介

①HTTP（超文本传输协议HyperText Transfer Protocol）协议是互联网上应用最为广泛的一种网络协议，它是基于TCP协议的应用层传输协议，简单来说就是客户端和服务端进行数据传输的一种规则。

②HTTP/HTTPS是应用层上的协议，建立在传输层TCP之上，客户端通过与服务端进行TCP连接(三次握手)，之后发送HTTP请求与接收HTTP响应都是通过访问Socket接口来调用TCP协议实现

③HTTP 是一种无状态 (stateless) 协议, HTTP协议本身不会对发送过的请求和相应的通信状态进行持久化处理（存储，保存）。这样做的目的是为了保持HTTP协议的简单性，从而能够快速处理大量的事务, 提高效率。然而，在许多应用场景中，我们需要保持用户登录的状态或记录用户购物车中的商品。由于HTTP是无状态协议，所以必须引入一些技术来记录管理状态，例如Cookie。

⑤cookie和session都为了实现的是http的短期的持久化(内存/缓存方式，查询快、效率比较高)，cookie是缓存在用户端（client)浏览器中的（默认缓存一天），当下次客户端通过同一个浏览器访问客户端的时候，会优先读取cookie中的缓存信息，向服务端进行请求，同时服务端收到客户端请求的时候，读取到cookie文件，知道客户端之前找的是服务器A处理的任务，为了省事儿，省资源，干脆直接讲请求直接再交给服务器A处理。

两者对比:

cookie 省服务器性能
session 更安全

2、HTTP协议的版本

HTTP 0.9已过时

HTTP 1.0（完善的请求、响应模型并且协议补充（完整） get post head方法）

HTTP 1.1（新增五种请求方式：OPTIONS PUT DELETE TRACE CONNECT）

HTTP 2.0

HTTP1.0和HTTP1.1之间的区别

缓存处理

在HTTP1.0中主要使用header里的If-Modified-Since,Expires来做为缓存判断的标准，HTTP1.1则引入了更多的缓存控制策略例如Entity tag，If-Unmodified-Since, If-Match, If-None-Match等更多可供选择的缓存头来控制缓存策略。

带宽优化及网络连接的使用

HTTP1.0中，存在一些浪费带宽的现象，例如客户端只是需要某个对象的一部分，而服务器却将整个对象送过来了，并且不支持断点续传功能，HTTP1.1则在请求头引入了range头域，它允许只请求资源的某个部分，即返回码是206（Partial Content），这样就方便了开发者自由的选择以便于充分利用带宽和连接

错误通知的管理

在HTTP1.1中新增了24个错误状态响应码，如409（Conflict）表示请求的资源与资源的当前状态发生冲突；410（Gone）表示服务器上的某个资源被永久性的删除

Host头处理

在HTTP1.0中认为每台服务器都绑定一个唯一的IP地址，因此，请求消息中的URL并没有传递主机名（hostname）。但随着虚拟主机技术的发展，在一台物理服务器上可以存在多个虚拟主机（Multi-homed Web Servers），并且它们共享一个IP地址。HTTP1.1的请求消息和响应消息都应支持Host头域，且请求消息中如果没有Host头域会报告一个错误（400 Bad Request）

长连接

HTTP 1.1支持长连接（PersistentConnection）和请求的流水线（Pipelining）处理，在一个TCP连接上可以传送多个HTTP请求和响应，减少了建立和关闭连接的消耗和延迟，在HTTP1.1中默认开启Connection： keep-alive，一定程度上弥补了HTTP1.0每次请求都要创建连接的缺点

3、HTTP请求格式

GET方式

① 请求行

请求的方式
请求的资源路径
请求的版本协议号

② 请求头（描述信息/标准化信息）

Accept：客户端可以接受的数据类型
Accept-Language：客户端可以接受的语言类型
User-Agent：浏览器的信息
Accpect-Encoding：客户端可以接受的编码格式
Host：表示请求的ip和端口号
Connection：告诉服务器请求连接如何处理
Keep-Alive：通知服务器回传数据不要马上关闭，保持一小段的连接
Closed：马上关闭

POST 请求方式

① 请求行

请求的方式
请求的资源路径
请求的协议的版本号

② 请求头

Accept：客户端可以接受的数据类型
Accept-Language：客户端可以接受的语言类型
Referer：表示请求发起时，浏览器地址栏中的地址
User-Agent：浏览器的信息
Content-Type：发送的数据类型
Content-Length：发送的数据长度

③ 请求体

就是发送给服务器的数据

区别

区别一:语义上的区别

Get向服务器请求数据，依照HTTP协议，get 是用来请求数据。

Post向服务器发数据，依照HTTP协议，Post的语义是向服务器添加数据，也就是说按照Post的语

义，该操作是会修改服务器上的数据

区别二：服务器请求的区别

Get请求是可以被缓存，示例：访问百度，访问的方式就是GET，此时访问后的内容会缓被存在浏览器中，短时间再次访问，其实是拿到的浏览器中的缓存内容

另外Get请求只能接收ASCII码的回复

Post请求是不可以被缓存的。对于Post方式提交表单，刷新页面浏览器会弹出提示框“是否重新提交表单”，Post可以接收二进制等各种数据形式，所以如果要上传文件一般用Post请求

区别三:参数放请求头和请求体的差别

Get请求通常没有请求体（当然这也是可以由程序猿心情改变的），在TCP传输中只需传输一次（而不是一个包），所以Get请求效率相对高。

Post请求将数据放在请求体中，而实际传输中，会先传输完请求头，再传输请求体，是分为两次传输的（而不是两个包）。Post请求头会比Get更小（一般不带参数），请求头更容易在一个TCP包中完成传输，更何况请求头中有Content-Length的标识，可以更好地保证Http包的完整性。

4、HTTP协议请求流程分析

HTTP协议（HyperText Transfer Protocol，超文本传输协议）：是一种发布和接收 HTML页面的方法。
HTTPS（Hypertext Transfer Protocol over Secure Socket Layer）简单讲是HTTP的安全版，在HTTP下加入SSL层。
SSL（Secure Sockets Layer 安全套接层）主要用于Web的安全传输协议，在传输层对网络连接进行加密，保障在Internet上数据传输的安全。
HTTP的端口号为80，
HTTPS的端口号为443；
浏览器的主要功能是向服务器发出请求，在浏览器窗口中展示您选择的网络资源，HTTP是一套计算机通过网络进行通信的规则。
HTTP请求是指：客户端通过发送 HTTP 请求向服务器请求对资源的访问。它向服务器传递了一个数据块，也就是请求信息，HTTP 请求由三部分组成：请求行、请求头和请求正文。
请求返回的状态码见如下链接：https://blog.csdn.net/weixin_51099370/article/details/124854583