第一章Wet基础与HTTP协议

目录

一、web基础

1.域名概述

2.域名结构 

3.html 文件概述 

HTML 基本标签 

(1)HTML 语法规则

(2)HTML 文件结构

(3)标签中常用标签

(4)内容标签中常用标签 

4.静态页面与动态页面 

静态页面

动态页面

HTTP协议版本 

http请求方法

http常见状态码

常见状态码 


一、web基础

1.域名概述

网站通常需要有一个名,可以在万维网站上申请购买域名,并且在公安系统进行备案,方可在国内使用。

2.域名结构 

主机名.子域【.二级域】.顶级域

域名解析:在本机的 hosts 定义,在DNS解析

DNS解析过程:(客户端 ----> 本地缓存域名服务器 ----> 根域名服务器 ----> 顶级域名服务器 ----> 二级域 / 子域名服务器 ----> 根据主机名解析出 IP )

3.html 文件概述 

html 概述

HTML叫做超文本标记语言,是一种规范,也是一种标准,它通过标记符号来标记要显示的网页中的各个部分。网页文件本身是一种文本文件,通过在文本文件中添加标记符,可以告诉浏览器如何显示其中的内容。

HTML文件可以使用任何能够生成txt文件的文本编辑器来编辑,生成超文本标记语言文件,只用修改文件名后缀为”.html”或“.htm”即可。

HTML 基本标签 
(1)HTML 语法规则

HTML标签采用双标记符的形式,前后标记符对应,分别表示标记开始和结束,标记符中间的内容被标签描述。前标记符由“<XXX>”表示,结尾标记符多了一个“/”,由“</XXX>”表示。

(2)HTML 文件结构

HTML文件最外层由<html> </html>

(3)标签中常用标签
标签描述
<title>定义了文档的标题
<base>定义了页面链接标签的默认链接地址
<link>  定义了一个文档和外部资源之间的关系
<meta>    定义了 HTML 文档中的元数据
<script>定义了客户端的脚本文件
<style> 定义了 HTML 文档的样式文件
(4)内容标签中常用标签 
标签描述
<table>  定义一个表格
<tr>定义了表格中的一行
<td>定义了表格中某一行的一列
<img>  定义了一个图像
<a>  定义了一个超链接
<p> 定义了一行
<br>定义了换行
<font>定义了字体
<h1>  定义字体大小

4.静态页面与动态页面 

静态页面

静态网页是标准的HTML文件,它的文件扩展名是 .htm、.html、.shtml等。没有后台数据库支持,不包含任何应用程序,网页不可交互,ULL网页路径中不含有 ? 。静态网页是网站建设的基础,早期的网站一般都是由静态网页制作的。静态网页也可以出现各种动态的效果,如.GIF格式的动画、FLASH、滚动字幕等。这些“动态效果”只是视觉上的,与下面将要介绍的动态网页是不同的概念。

动态页面

有后台数据库支持,网页可交互,也可以自动更新,网页内容会包含用php  java  python 等高级编程语言编写的应用程序,URL 网页路径中含有标志性的 ? 用于传参。动态网页页面代码虽然没有变,但是显示的内容却是可以随着时间、环境或者数据库操作的结果而发生改变的。动态网页URL的后缀不是.htm、.html、.shtml、.xml等静态网页的常见网页制作格式,以.aspx、.asp、.jsp、.php、.perl、.cgi等形式为后缀,并且在动态网页网址中有一个标志性的符号——“?”。动态网页是基本的html语法规范与Java、PHP、C#等高级程序设计语言、数据库编程等多种技术的融合,以期实现对网站内容和风格的高效、动态和交互式的管理。因此,从这个意义上来讲,凡是结合了HTML以外的高级程序设计语言和数据库技术进行的网页编程技术生成的网页都是动态网页。

动态网页语言 
早期的动态网页主要采用通用网关接口 CGI(Common Gateway Interface)技术,虽然 CGI 技术已经发展成熟而且功能强大, 但由于编程困难、效率低下、修改复杂,所以有逐渐被新技术取代的趋势。

目前常用的动态网页编程语言如下:
●PHP
即 Hypertext Preprocessor(超文本预处理器),它是当今 Internet 上最为火热的脚本语言,其语法借鉴了 C、Java、PERL 等语言,但只需要很少的编程知识你就能使用 PHP 建立一个真正交互的 Web 站点。

●JSP
即 Java Server Pages(Java 服务器页面),它是由 Sun Microsystem 公司于 1999 年 6 月推出的新技术,是基于 Java Servlet 以及整个 Java 体系的 Web 开发技术。

●Python 
是一种面向对象、跨平台的动态类计算机程序设计语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越来越多被用于独立的大型项目开发。

●Ruby
是一种简单快捷的面向对象(面向对象程序设计)脚本语言,在 20 世纪 90年代由日本人松本行弘(Yukihiro Matsumoto) 开发,遵守GPL 协议和Ruby License。它的灵感与特性来自于 Perl、Smalltalk、Eiffel、Ada 以及 Lisp 语言。

二、HTTP协议
概述
HTTP协议采用了请求/响应模型。客户端向服务器发送一个请求,请求头包含请求的方法、URL、协议版本、以及包含请求修饰符、客户信息和内容的类似于MIME的消息结构。服务器以一个状态行作为响应,响应的内容包括消息协议的版本,成功或者错误编码加上服务器信息、实体元信息以及可能的实体内容。

HTTP协议版本 

http请求方法

GET                 对服务器资源获取的简单请求,可以理解为读取或者下载数据
PUT                 向服务器提交数据,以修改数据
DELETE          删除服务器上的某些资源
POST              用于发送包含用户提交数据的请求
HEAD             请求页面的首部,获取资源的元信息
CONNECT      建立特殊的连接隧道
OPTIONS       列出可对资源实行的方法
TRACE           追踪 请求 - 响应 的传输路径

注:GET 和 POST 比较
●GET 方法:从指定的服务器上获得数据
GET请求能被缓存
GET请求会保存在浏览器的浏览纪录里
GET请求有长度的限制
主要用于获取数据
查询的字符串会显示在URL后缀中,不安全,比如 http://www.test.com/a.php?Id=123 

●POST 方法:提交数据给指定服务器处理
POST请求不能被缓存
POST请求不会保存在浏览器的浏览纪录里
POST请求没有长度限制
查询的字符串不会显示在URL中,比较安全

http常见状态码

状态码首位 已定义范围  分类 
1xx100-101信息提示
2xx 200-206成功
3xx 300-305重定向
4xx400-415 客户端错误
5xx 500-505 服务器错误

常见状态码 

状态码    功能描述
200       一切正常
301      永久重定向
302      临时重定向
401      用户名或密码错误
403      禁止访问(客户端IP地址被拒绝)
404     请求的文件不存在,代表客户端请求的URI文件路径有误,服务器没有相对应的路径没有该网页文件
414      请求URI头部过长
500      服务器内部错误,通常是服务端应用程序有BUG导致
502      无效网关,网关代理服务器接收到来自服务端返回的无效或错误响应消息导致
503      当前服务不可用,代表服务器可能已经过载或者正在维护/宕机导致的
504      网关请求超时,网关代理服务器无法在超时时间内接收到来自服务端的响应消息导致(后端服务器响应超时)

三、HTTP请求流程分析
        用户在浏览器输入URL访问时,发起HTTP请求报文,请求中包括请求行、请求头、请求体,服务器收到请求后返回响应报文,包括状态行、响应头、响应体。 

1.请求报文

  • 请求行:请求行由请求方法、URL 以及协议版本三部分组成。
  • 请求头:请求头为请求报文添加了一些附加信息,由“名/值”对组成,每行一对,名和值之间使用冒号分隔。
  • 空行:   请求头部的最后会有一个空行,表示请求头部结束,接下来为请求体,这一行非常重要,必不可少。
  • 请求体:请求体是请求提交的参数,GET 方法已经在 URL 中指明了参数,所以提交时没有数据。POST 方法提交的参数在请求体中。

 常用的请求头:

  • Host                接受请求的服务器地址,可以是 IP:端口号,也可以是域名
  • User-Agent            发送请求的应用程序名称
  • Connection            指定与连接相关的属性,如 Connection:Keep-Alive
  • Accept-Charset        通知服务端可以发送的编码格式
  • Accept-Encoding        通知服务端可以发送的数据压缩格式
  • Accept-Language        通知服务端可以发送的语言

2.响应报文

  • 状态行:状态行由协议版本,状态码,状态码描述三部分组成。
  • 响应头:响应头与请求头部类似,为响应报文添加了一些附加信息。
  • 空行:响应头部的最后会有一个空行,表示响应头部结束。
  • 响应体:服务器返回的相应 HTML 数据,浏览器对其解析后显示页面。

 常见响应头:

  • Server                服务器应用程序软件的名称和版本
  • Content-Type        响应正文的类型(是图片还是二进制字符串)
  • Content-Length        响应正文长度
  • Content-Charset     响应正文使用的编码
  • Content-Encoding    响应正文使用的数据压缩格式
  • Content-Language    响应正文使用的语言
  • 13
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值