Web基础与HTTP协议

本文深入介绍了Web基础知识,包括DNS的三种解析方式(/etc/hosts、/etc/resolv.conf、网卡配置文件)、域名空间结构与注册流程、HTTP协议的版本和请求格式,以及静态与动态网页的区别。此外,还讲解了HTTP状态码和Web1.0与Web2.0的对比,是理解互联网工作原理的绝佳教程。
摘要由CSDN通过智能技术生成

前言:主播已经好的差不多啦,这章我们来看一下web的基础知识,其中包含了域名的概念,DNS的原理等一系列相关知识,希望拐友们能够好好看

目录

1.DNS与域名

1.1域名和IP地址的介绍

2.DNS的三种解析方式

2.1./etc/hosts

2.2/etc/resolv.conf

2.3在网卡配置文件中定义

3.域名服务和域名注册

3.1域名空间结构

 3.2域名注册

  3.3域名服务

 4.网页(HTTP/HTTPS)

 4.1网页基本概念

4.2HTML文档的结构

4.2.1HTML超文本标记语言

4.2.2HTML文档的结构(HTML网页)

4.2.3网页摘要信息的作用

4.2.4网页基本标签

5.Web

5.1.Web概述

5.2.web1.0与web2.0的区别

6.静态网页和动态网页

6.1静态网页的定义

6.2静态网页的特点

6.3动态网页

6.4动态页面特点

7.HTTP协议概述

7.1HTTP协议简介

7.2HTTP协议的版本

7.3HTTP请求格式

7.3.1GET方式(请求行)

7.3.2请求头(描述信息/标准化信息)

7.3.3POST 请求方式(请求行)

7.3.4请求头

7.4GET与POST的区别

八.HTTP状态码

8.1生产环境常见的HTTP状态码

8.2HTTP请求流程

9.总结


1.DNS与域名

1.1域名和IP地址的介绍

  • 网络上交互是基于TCP/IP协议的,每个主机在逻辑上有一个唯一位置标识(地址),物理地址为NAC地址
  • 为了保证地址唯一性,用户协议向特地的机构申请注册,分配IP地址网络中的地址有两套方案: IP地址系统、域名地址系统
  • 而由于IP是由32位二进制数字标识,不方便记忆,所以、以IP地址为基础发展出了符号化地址来代替解决方案,也是是域名

    ps:固定的IP地址是逻辑地址

2.DNS的三种解析方式

2.1./etc/hosts

linux系统中负责快速解析的文件,包含了ip与主机名的映射关系,在没有DNS服务器的情况下,使用本地/etc/hosts完成解析/映射,实现快速访问
Ps:主要用于主机之间(IP和主机名)的映射/解析关系,示例:192.168.226.128 master
192.168.226.129 node1
192.168.226.130 node2

2.2/etc/resolv.conf

DNS客户端配置文件,主要用于设置DNS服务器的P和域名,还包含了主机域名的搜索顺序等等,这个文件是由域名解析器(resolver,一个根据主机名解析IP地址的库)使用的配置文件。
PS:主要用与匹配DNS服务器,示例:

nameserver 218.2.135.1(这里指南京的DNS)
nameserver 114.114.114.114(这里指电信的DNS)
nameserver 8.8.8.8(这里指谷歌的DNS)

2.3在网卡配置文件中定义

/etc/ sysconfig/ network-scripts/ifcfg-ens33(直接在网卡设置面种定义)
DNS1=114.114.114.114
DNS2=8.8.8.8

ps:★生效顺序:1 hosts文件 ▶▶▶ 2网卡配置文件 ▶▶▶3 /etc/resolv.conf

3.域名服务和域名注册

3.1域名空间结构

  • 根域 位于域名空间最顶层,一般用一个"." 表示基础单位,除了根域其他都只有一个上级域,有o或多个子域,同层域不可重复的子域或域名
  • 顶级域 一般代表一种类型的组织机构或国家地区(主要有此两种类型构成),如net(网络公司),com(商业),org(民间团体组织),edu(教育),gov(政府),mil(军事),cn(中国),jp(日本),hk(中国香港)
  • 二级域 (如www.taobao.com)也叫子域用来标明顶级域内的一个特定的组织,国家顶级域下面的二级域名由国家网络部门统一管理,如 .cn顶级域名下面设置的二级域名: .com.cn、.net.cn、 .edu.cn …
  • 子域  用来标明顶级域内的一个特定的组织,国家顶级域下面的二级域名由国家网络部门统一管理,如 .cn顶级域名下面设置的二级域名: .com.cn、.net.cn、 .edu.cn …
  • 主机 主机位于域名空间最下层,就是一台具体的计算机,如www、mail、都是具体的计算机名字,可用www.sina.com.cn.、mail.sina.com.cn、来表示,这种表示方式称为FQDN(完全合格域名),也是这台主机在域名中的全名

 3.2域名注册

  • 域名注册是Internet中用于解决地址对应问题的一种方法,遵循先申请先注册原则
  • 域名注册步骤:  
  •  1.准备申请资料   2.寻找域名注册网站  3.查询域名  4.正式申请 5.申请成功

  3.3域名服务

  • 分布式:把一个整体的文件若干个分给其他的机器
  • 层次性:类似dns,比如根域,顶级域,二级域这样一层一层下来

 4.网页(HTTP/HTTPS)

 4.1网页基本概念

  • 纯文本格式文件
  • 编写语言为HTML
  • 在用户的浏览器种被“翻译”成网页形式显示出来
网站由一个一个页面构成的,是多个网页的结合体
主页打开网站后出现的第一个网页称为网站主页(或首页)
域名浏览网页时输入的网址
HTTP用来传输网页的通信协议
URL是一种万维网寻址系统
HTML用来编写网页的超文本标记语言
超链接超链接是将网站种不同网页链接起来的功能
发布将制作好的网页上传到服务器供用户访问的过程

思路图

当用户写一个页面去访问时,浏览器会测试是否符合要求,如果符合那就提供服务,如果不符合就拒绝服务或报错,并返回给用户。

4.2HTML文档的结构

4.2.1HTML超文本标记语言

  • Hyper Text Markup Language
  • 网页的"源码"

4.2.2HTML文档的结构(HTML网页)

  • 头部部分
  • 标题部分
  • 主体部分
  • 网页内容,包括文本,图像等

4.2.3网页摘要信息的作用

  •  有利于浏览器的解析
  • 有利于搜索引擎搜索

4.2.4网页基本标签

  • 标题标签
  • 行控制相关标签
  • 范围标签
  • 图像标签
  • 超链接标签
  • 特殊符号

5.Web

5.1.Web概述

  • Webworld wide web)即全球广域网,也称为万维网
  • 一种分布式图形信息系统
  • 建立在Internet上的一种网络服务

5.2.web1.0与web2.0的区别

  • web1.0

以编辑为特征,网站提供给用户的内容是编辑处理后的,然后用户阅读网站提供的内容这个过程是网站到用户的单向行为(静态页面的概念)

  • web2.0

更注重用户的交互作用,用户既是网站内容的消费者(浏览者),也是网站内容的制造者
加强了网站与用户之间的互动,网站内容基于用户提供,网站的诸多功能也由用户参与建设,实现了网站与用户双向的交流和参与

  • web2.0特征        

用户分享、以兴趣为聚合点的社群、开放的平台,活跃的用户

简单来说web1时单向的,只能编辑,不能交互

              web2可以交互

6.静态网页和动态网页

6.1静态网页的定义

  • 静态网页是标准的HTML文件扩展名是.htm .html
    例如文本、图像、声音、Flash动画、客户端脚本和Activex控件及Java小程序等
  • 是网站建设的基础,早期网站一般都由静态网页制作
  • 没有后台数据库、不含程序和不可交互的网页
  • 相对更新起来比较麻烦,适用于一般更新较少的展示型网站

6.2静态网页的特点

  • 每个静态网页都有一个固定的URL,且URL以.htm、.html、.shtml等常见形式为后缀,而不含有"?"
  • 网页内容一经发布到网站服务器上,无论是否有用户访问,每个静态网页都是保存在网站服务器上的
  • 静态网页的内容相对稳定,容易被搜索引擎检索
  • 静态网页没有数据库的支持,在网站制作和维护方面工作量较大,因此当网站信息量很大时完全依靠静态网页制作方式比较困难
  • 静态网页的交互性较差,在功能方面有较大的限制
    页面浏览速度迅速,过程无需连接数据库,开启页面速度快于动态页面

6.3动态网页

  • 网页URL不固定,能通过后台与用户交互,在动态网页网址中有一个标志性的符号——"?"
  • 常用的语言有PHP、JSP、Python、Ruby等(其中PHP、JSP、Python用的比较多

6.4动态页面特点

  • 交互性   

       网页会根据用户的要求和选择而动态改变和响应,将浏览器作为客户端界面,这将是今后               wBB发展的大势所趋

  • 自动更新

       无须手动地更新HTML文档,便会自动生成新的页面,可以大大节省工作量

  • 因时因人而变

       当不同的时间,不同的人访问同一网址时会产生不同的页面

7.HTTP协议概述

7.1HTTP协议简介

  • HTTP协议是互联网上应用最为广泛的一种网络协议,设计这个协议的目的是为了发布和接收Web服务器上的HTML页面。它是基于TCP协议的应用层传输协议,简单来说就是客户端和服务端进行数据传输的一种规则。
  • HTTP/HTTPS是应用层上的协议,建立在传输层TCP之上,客户端通过与服务端进行TCP连接(三次握手),之后发送HTTP请求与接受HTTP相应都是通过访问Socket接口来调用TCP协议实现。
  • HTTP是一种无状态协议HTTP协议本身不会对发送过的请求和相应的通信状态进行持久化处理(存储,保存)。这样做的目的是为了保持HTTP协议的简单性,从而能够快速处理大量的事务, 提高效率。然而,在许多应用场景中,我们需要保持用户登录的状态或记录用户购物车中的商品。由于HTTP是无状态协议,所以必须引入一些技术来记录管理状态,例如Cookie。
  • cookiesession都为了实现的是http的短期的持久化(内存/缓存方式,查询快、效率比较高),cookie是缓存在用户端(client)浏览器中的(默认缓存一天),当下次客户端通过同一个浏览器访问客户端的时候,会优先读取cookie中的缓存信息,向服务端进行请求,同时服务端收到客户端请求的时候,读取到cookie文件,知道客户端之前找的是服务器A处理的任务,为了省事儿,省资源,干脆直接讲请求直接再交给服务器A处理。

ps:cookie 省服务器性能

        session 更安全

7.2HTTP协议的版本

  • HTTP/0.9:已过时
  • HTTP/1.0:完善的请求,相应模型   并且协议补充(完整)   get post head方法
  • HTTP/1.1:现在1.0基础上进行更新,新增五种请求方式:OPTIONS   PUT  DELETE TRACE  CONNECT
  • HTTP/2.0

7.3HTTP请求格式

7.3.1GET方式(请求行)

  • 请求的方式
  • 请求的资源路径
  • 请求的版本协议号

7.3.2请求头(描述信息/标准化信息)

Accept客户端可以接受的数据类型
Accept-Language客户端可以接受的语言类型
User-Agent浏览器的信息
Accpect-Encoding客户端可以接受的编码格式
Host

表示请求的ip和端口号

Connection告诉服务器请求连接如何处理
Keep-Alive通知服务器回传数据不要马上关闭,保持一小段的连接
Closed马上关闭

7.3.3POST 请求方式(请求行)

  • 请求的方式
  • 请求的资源路径
  • 请求的协议的版本号

7.3.4请求头

Accept

客户端可以接受的数据类型

Accept-Language客户端可以接受的语言类型
Referer表示请求发起时,浏览器地址栏中的地址
User-Agent浏览器的信息
Content-Type发送的数据类型
Content-Length发送的数据长度

请求体:就是发送给服务器的数据

7.4GET与POST的区别

1.语义上的区别

1.Get向服务器请求数据,依照HTTP协议,get 是用来请求数据。

2.Post向服务器发数据,依照HTTP协议,Post的语义是向服务器添加数据,也就是说按照Post的语

义,该操作是会修改服务器上的数据

2.服务器请求的区别

1.Get请求是可以被缓存,示例:访问百度,访问的方式就是GET,此时访问后的内容会缓被存在浏览器中,短时间再次访问,其实是拿到的浏览器中的缓存内容

另外Get请求只能接收ASCII码的回复

2.Post请求是不可以被缓存的。对于Post方式提交表单,刷新页面浏览器会弹出提示框“是否重新提交表单”,Post可以接收二进制等各种数据形式,所以如果要上传文件一般用Post请求

3.参数放请求头和请求体的差别

1.Get请求通常没有请求体(当然这也是可以由程序猿心情改变的),在TCP传输中只需传输一次(而不是一个包),所以Get请求效率相对高。

2.Post请求将数据放在请求体中,而实际传输中,会先传输完请求头,再传输请求体,是分为两次传输的(而不是两个包)。Post请求头会比Get更小(一般不带参数),请求头更容易在一个TCP包中完成传输,更何况请求头中有Content-Length的标识,可以更好地保证Http包的完整性。

4.简单的理解:

GET方法:
从指定的服务器上获得数据
GET请求能被缓存
GET请求会保存在浏览器的浏览记录里
GET请求有长度的限制
主要用于获取数据
查询的字符串会显示在URL中,不安全

POST方法:
提交数据给指定服务器处理
POST请求不能被缓存
POST请求不会保存在浏览器的浏览记录里
POST请求没有长度限制
查询的字符串不会显示在URL中,比较安全

八.HTTP状态码

状态码首位已定义范围分类
1xx100-101信息提示
2xx200-206成功
3xx300-305重定向
4xx400-415 客户端错误
5xx500-505服务器错误

8.1生产环境常见的HTTP状态码

消息描述
200 OK请求成功(其后是对GET和POST请求的应答文档)
301 Moved Permanently请求的永久页面跳转
403 Forbidden禁止访问该页面
404 Not Found服务器无法找到被请求的页面
500 Internal Server Error 内部服务器错误
502 Bad Gateway 无效网关
503 Service Unavailable当前服务不可用
504 Gateway Timeout网关请求超时

8.2HTTP请求流程

用户在浏览器输入URL访问时,发起HTTP请求报文,请求中包括请求行、请求头、请求体,服务器收到请求后返回响应报文,包括状态行、响应头、响应体。

 详细版:

客户端解析到IP地址后会通过TCP的三次握手与服务器建立连接,首先客户端向服务器发送请求连接报文,SYN=1初始序号seq为x,这时客户端进入SYN-SENT状态,服务器确认请求报文ACK=1,SYN=1,确认序号ACK=X+1,服务器产生的初始序号seq=y,回复客户端确认连接,此时服务器进入SYN-RCVD状态,客户端接受后确认报文ACK=1,ACK=y+1,客户端又重组序号为x+1。TCP连接已经建立,客户端进入ESTABLISHED 状态,当服务器收到客户端的确认后,也会进入 ESTABLISHED 状态。客户端连接到IP地址,发送httpGET的请求,从服务器读取http响应。

   之后断开连接时,需要通过TCP的四次挥手完成,客户端向服务器发送断开连接请求报文,FIN=1,ACK=1,序号为u,客户端处于FIN—WAIT-1(终止等待1)状态,服务器确认报文ACK=1,确认序号为ACK=u+1,服务器的序号为v,回复客户端,服务器服务端处于CLOSE—WAIT(关闭等待)状态,客户端接受确认报文ACK=1,确认序号ACK=v+1,客户端重组序号为seq=u+1,客户端处于FIN—WAIT-2(终止等待2)状态,然后服务器也想让客户端断开连接,就发送了断开连接请求,FIN=1,ACK=1,服务器重组序号为w,服务器服务端处于LAST—ACK(最后确认)状态,客户端接受后确认报文ACK=1.确认序号为ACK=w+1,客户端序号为u+1,客户端进入CLOSED(时间等待)状态,等待最长报文段寿命2*MSL,服务器确认后,立即进入关闭状态。然后进行关闭连接。

9.总结

1.域名空间结构

2.HTML文档结构

3.网页基本标签

4.Web1.0和Web2.0区别

5.post和get方法区别

6.HTTP协议报文格式

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值