目录
web基础
域名和dns
域名的概念
网络是基于TCP/IP协议进行通信和连接的,每一台主机都有一个唯一的标识(固定的IP地址),用以区别在网络上成千上万个用户和计算机。网络在区分所有与之相连的网络和主机时,均采用一种唯一、通用的地址格式,即每一个与网络相连接的计算机和服务器都被指派一个独一无二的地址。为了保证网络上每台计算机的IP地址的唯一性,用户必须向特定机构申请注册,分配IP地址。网络中的地址方案分为两套:IP地址系统和域名地址系统。
域名的结构
DNS规定,域名中的标号都由英文字母和数字组成,每一个标号不超过63个字符,也不区分大小写字母。标号中除连字符(-)外不能使)用其他的标点符号。级别最低的域名写在最左边,而级别最高的域名写在最右边。
域名结构类型
根域:指的是根服务器,要用来管理互联网的主目录,全世界只有13台。1个为主根服务器,放置在美国。其余12个均为辅根服务器,其中9个放置在美国欧洲2个,位于英国和瑞典:亚洲1个,位于日2本。所有根服务器均由美国政府授权的互联网域名与号码分配机构ICANN统一管理,负责全球互联网域
名根服务器、域名体系和IP地址等的管理。
顶级域:包括组织域和国家/地区域名。域名的最右侧是国家/地区域名,国家代码由两个字母组成的如.cn,.uk,.de和.jp,其中.cn是中国专用的顶级域名。在国家/地区域名左侧,是组织域名,常见的.com用于商业机构,.net用于网络组织,.org用于各种组织包括非盈利组织。
FQDN:是主机名.DNS后缀,是指主机名加上全路径,全路径中列出了序列中所有域成员。全域名可以从逻辑上准确地表示出主机在什么地方,也可以说全域名是主机名的一种完全表示形式。
hosts文件
Hosts文件是一个用于存储计算机网络中节点信息的文件,它可以将主机名映射到相应的IP地址,实现DNS的功能,它可以由计算机的用户进行修改控制。
hosts文件的作用
在网络上访问网站,要首先通过DNS服务器把要访问的域名解解析成IP地址后,计算机才能对这个网络域名作网站进行访问。
在网络上访问网站,要首先通过DNS服务器把要访问的域名解析成IP地址后计算机才能对这个网络域名作网站进行访问。
对于每个域名请求,如果都要等待域名服务器解析后返回IP信息,那么访问网络的效率就会降低,因为DNS做域名解析和返回IP都需要时间。为了提高对
经常访问的网络域名的解析效率,可以通过利用在Hosts文件中建立域名和IP的映射关系来达到目的。根据系统规定,在进行DNS请求以前,系统会先
检查自己的Hosts文件中是否有这个网络域名映射关系。如果有则调用这个IP地址映射,如果没有,再向已知的DNS服务器提出域名解析,即Hosts的请求级别比DNS高。
修改hosts文件
Windows系统中Hosts文件存储在目录 c:\windows\system32\drivers\etc\下面,用记事本可以对其进行修改,OpenEuler系统中Hosts文件存储在目录/etc/目录下面,用vim/etc/hosts可以对其进行修改,如在文件中加上以下代码。
127.0.0.1 www.baidu.com
dns
在互联网上域名与IP地址之间是一一对应的,域名虽然便于人们记忆,但机器之间只能互相认识IP地址,它们之间的转换工作称为域名解析,域名解析要由专门的域名解析系统来完成,DNS就是进行域名解析的系统主机名到IP地址的映射有两种方式:
静态映射:每台设备上都配置主机到IP地址的映射,各设设备独立维护自己的映射表,而且只供本设备使用;
动态映射:建立一套域名解析系统(DNS),只在专门的DNS服务器上配置主机到IP地址的映射,网络上需要使用主机名通信的设备,首先需要到DNS.
服务器查询主机所对应的IP地址。
通过主机名,最终得到该主机名对应的IP地址的过程叫做域名解析(或主机名解析)。在解析域名时,可以首先采用静态域名解析的方法。如果静态域名解析不成功,再采用动态域名解析的方法。可以将一些常用的域名放入静态域名解析表中,这样可以大大提高域名解析效率。在Windows命令行模式中输入网络查询命令nslookup www.baidu.com,可以查询到域名对应的IP地址。
域名注册
域名注册是Internet中用于解决地址对应问题的一种方法。域名注册遵循先申请先注册原则,管理机构对申请人提出的域名是否违反了第三方的权利不进行任何实质审 查。每个域名都是独一无二的,不可重复的的。域名注册的所有者都是以域名注册提交人填写域名订单的信息为准的,成功24小时后,即可在国际(ICANN)、国内(CNNIC)管理机构查询whois信息(域名所有者等信息)。
域名注册步骤
(1)准备申请资料:com域名无需提供身份证、营业执照等资料,cn域名已开放个人申请注册,所以申请则需要提供身份证或企业营业执照
(2)寻找域名注册网站:由于.com、.cn域名等不同后缀均属于不同注册管理机构所管理,如要注册不同后缀域名则需要从注册管理机构寻找经过其授权的顶级域名注册服务机构。如com域名的管理机构为ICANN,cn域名的管理几构为CNNIC(中国互联网络信息中心)。若注册商已经通过ICANN、CNNI双重认证,则无需分别到其他注册服务机构申请域名;
(3)查询域名:在域名注册查询网站注册用户名成功后并查询域名,选择要注册的域名,并点击注册;
(4)正式申请:查到想要注册的域名,并且确认域名为可申请请的状态后,提交注册,并缴纳年费;
(5)申请成功:正式申请成功后,即可开始进入DNS解析管理、设置解析记录等操作。
网页与html
网页是构成网站的基本元素,是承载各种网站应用的平台。通俗地说,网站就是由网页组成的。如果只有域名和虚拟主机而没有制作任何网页,那么客户仍旧无法访问这个网站。因为网页是由HTML(超文本标记语言)编写的。
网页可以包括如下内容
文本:文本是网页上最重要的信息载体与交流工具,网页中的主要信息一般都以文本形式为主。
图像:图像元素在网页中具有提供信息并展示直观形象的作菲角
静态图像:在页面中可能是图片或矢量图形。图片格式通常常为GIF
JPEG或PNG等;矢量格式通常为SVG或Flash。
动画图像:通常动画为GIF和SVG。
Flash动画:动画在网页中的作用是有效地吸引访问者更多多的注意
声音:声音是多媒体和视频网页重要的组成部分。
视频:视频文件的采用使网页效果更加精彩且富有动感。
表格:表格是在网页中用来控制页面信息的布局方式。
导航栏:导航栏在网页中是一组超链接,其连接的目的端是网页中重要的页面。
交互式表单:表单在网页中通常用来联接数据库并接受访同用户在浏览器端输入的数据,利用数据库为客户端与服务器端提供更多的互动。
网页相关概念如下
域名:是浏览网页时输入的网址。
HTTP:用来传输网页的通信协议,使用浏览器访问网址时,在域名前面要
加上http://,表示使用 http协议传输网页。
URL:是一种万维网寻址系统,表示网络上资源的位置路径。
HTML:是编写网页的超文本标记语言。
超链接:具备将网站中不同网页链接起来的功能。
发布:将制作好的网页上传到服务器供用户访问的过程。
html概述
HTML叫做超文本标记语言,是一种规范,也是一种标准,它通过标记符号来标记 要显示的网页中的各个部分。网页文件本身是一种文女本文件,通过在文本文件中添加标记符,可以告诉浏览器如何显示其中的内容容。如:文字如何处理,画面如何安排,图片如何显示等。浏览器按顺序阅读网页文件,然后根据标记符解释和显示其标记的内容,对书写出错的标记将不出其错误,且不停止其解释执行过程,开发者只能通过显示效果来分析出错原因和出错部位。但需要注意的是,不同的浏览器,对同一标记符可能会有不完全相同的解释,因而可能会有不同的显示效果。HTML文件可以使用任何能够生成txt文件的文本编辑器来编辑,生成超文本标记语言文件,只用修改文件名后缀为".html"或".htm"即可。
html基本标签
html基本标签
HTML标签采用双标记符的形式,前后标记符对应,分别表示标记开始和结束,标记符中间的内容被标签描述。前标记符由"<XXXX>"表示,结尾标记符多了一个"/",由"</XXXXX>"表示。
html文件结构
HTML文件最外层由<html></htm>表示,说明该文件是用HIML语言描述的。在它里面是并列的头标签(<head>)和内容标签(<body>),最基本的HTML文件结构。
<html>
<head>网页的内容描述信息<head>
<body>网页显示的内容</body>
</html>
常用的头标中的标签:
标签 | 描述 |
<title> | 定义了文档的标题 |
<base> | 定义了页面链接标签的默认链接地址 |
<link> | 定义了一个文档和外部资源之间的关系 |
<meta> | 定义html文档中的元数据 |
<script> | 定义了客户端的脚本文件 |
<style> | 定义html文档的样式文件 |
内容标签中常用的标签:
标签 | 描述 |
<table> | 定义一个表格 |
<tr> | 定义了表格中的一行 |
<td> | 定义了表格中某一行的一列 |
<a> | 定义了一个超链接 |
<br> | 定义了换行 |
<font> | 定义了字体 |
网站和主页
网站是由网页组成的,包含多个网页页面,具有独立域名、独立存放空间的内容集合,这些内容可能是网页,也可能是程序或其他文件.主页(首页)是用户打开浏览器时默认打开的网页。
当一个网站服务器收到一台电脑上网络浏览器的消息连接请求时,便会向这台计算机发送这个文档。当在浏览器的地址栏输入域名,而未指向特定目录或文件时,通常浏览器会打开网站的首页。网站首页往往会被编辑得易于了解该网站提供的信息,并引导互联网用户浏览网站其他部分的内容。这部分内容一般被认为是一个目录性质的内容。
静态网页与动态网页
静态网页
在网站设计中,纯粹HTML格式的网页通常被称为"静态网页",静态网页是标准的HTML文件,它的文件扩展名是.htm、.html。静态网页是网站建设的基础,早期的网站一般都是由静态网页制作的。静态网页也可以出现各种动态的效果,如.GIF格式的动画、FLASH、滚动字幕等。这些"动态效果"只是视觉上的,与下面将要介绍的动态网页是不同的概念。
动态网页
所谓的动态网页,是指跟静态网页相对的一种网页编程技术。静态网页,随着HTML代码的生成,页面的内容和显示效果就基本上不会发生变化了一一除非是修改页面代码。而动态网页则不然,页面代码虽然没有变,但是显示的内容却是可以随着时间、环境或者数据库操作的结果而发生改变的。
目前常用的动态网页编程语言如下:php(超文本预处理器),jsp(java服务器页面),python,ruby。
http协议概述
HTTP协议采用了请求/响应模型。客户端向服务器发送一个请求,请求头包含请求的方法、URL、协议版本、以及包含请求修饰符、客户信息和内容的类似于MIME的消息结构。服务器以一个状态行作为响应,响应的内容包括消息协议的版本,成功或者错误编码加上服务器信息、实体元信息以及可能的实体内容。
(1)HTTP/0.9已过时。只接受GET 一种请求方法,没有在通通讯中指定版本号,且不支持请求头。由于该版本不支持POST/方法,所以客户端无法向服务器传递太多信息。
(2)HTTP/1.0这是第一个在通讯中指定版本号的HTTP协议版本,至今仍被广泛采用,特别是在代理服务器中。
(3)HTTP/1.1当前版本。持久连接被默认采用,并能很好地配合代理服务器工作。还支持以管道方式同时发送多个请求,以便降低线路负载,提高传输速度。
http方法
HTTP支持几种不同的请求命令,这些命令被称为HTTP フ方法(HTTP method)。每条HTTP请求报文都包含一个方法,告诉服务器要热行什么动作,包括:获取一个页面,运行一个网关程序,删除一个文件等。最常用的获取资源的方法是GET、POST。HTTP常用方法如表1-3所示。
http方法 | 描述 |
GET | 请求获取request-uri所标识的资源 |
PUT | 请求服务器存储一个资源,并用request-uri作为其标识 |
DELETE | 请求服务器删除request-uri所标识的资源 |
POST | 在request-uri所标识的资源后附加新的数据 |
补充:HEAD 请求获取由request-uri所标识的资源的响应消息报头
GET方法采用的是URL后缀的形式,数作为内容进行了隐藏的提交。GET方法在URL上显示参数,而URL是有长度限制,故不适合提交通过大的数据。GET方法可以被浏览器缓存,当请求已经被请求过一次的URL时,浏览器不需要向服务器再次发出请求,直接在本地缓存中获得页面。
GET方法 | POST方法 | |
对数据长度的限制 | 的长度是受限制的(URL 的最大长度是2048个字符) | 无限制 |
缓存 | 能被缓存 | 不能缓存 |
安全性 | 相比,GET的安全性较差,因与POST为所发送的数据是URL的一部分。在发送密码或其他敏感信息时绝不要使用GET | POST比GET更安全,因为参数不会被保存在浏览器历史或Web服务器日志中 |
历史 | 参数保留在浏览器历史中 | 参数不会保存在浏览器历史中 |
后退 | 无害 | 数据会被重新提交,浏览器 应该告知用户数据会被重新提交 |
书签 | 可收藏为书签 | 不可收藏为书签 |
http状态码
HTTP状态码(HTTPStatus Code)是用以表示网页服务器器HTTP响应状态的3位数字代码,当浏览器请求某一URL时,服务器根据处理情况返回相应的处理状态。
http状态分类
状态码首位 | 已定义范围 | 分类 |
1xx | 100-101 | 信息提示 |
2xx | 200-206 | 成功 |
3xx | 300-305 | 重定向 |
4xx | 400-415 | 客户端错误 |
5xx | 500-505 | 服务器错误 |
生产环境常见的状态码
消息 | 描述 |
200 OK | 请求成功(其后是对GET和POST请求的应答文档) |
301MovedPermanently | 请求的永久页面跳转 |
403 Forbidden | 禁止访问该页面 |
404 Not Found | 服务器无法找到被请求的页面 |
500 InternalServerError | 内部服务器错误 |
502 Bad Gateway | 无效网关 |
503 ServiceUnavailable | 当前服务不可用 |
504 Gateway Timeout | 网关请求超时 |
http请求流程分析
请求报文
请求行:请求行由请求方法、URL以及协议版本三部分组成。
请求头:请求头为请求报文添加了一些附加信息,由"名/值"对组成,每行一对,名和值之间使用冒号分隔,常用的请求头:
请求头 | 描述 |
host | 接受请求的服务器地址,可以是IP:端口号,也可以是地减名 |
User-Agent | 发送请求的应用程序名称 |
Connection | 指定与连接相关的属性, |
Accept-Charset | 通知服务端可以发送的编码格式 |
Accept-Encoding | 通知服务端可以发送的数据压缩格式 |
Accept-Language | 通知服务端可以发送的语言 |
空行:请求头部的最后会有一个空行,表示请求头部结束,接下来为请求体,这一行非常重要,必不可少。
请求体:请求体是请求提交的参数,GET方法已经在URL中指明了参数,所以提交时没有数据。POST方法提交的参数在请求体中。
响应报文
状态行:状态行由协议版本,状态码,状态码描述三部分组成。
响应头与请求头部类似,为响应报文添加了一些附加信息。常见响应头部如表所示。
响应头 | 描述 |
server | 服务器应用程序软件的名称和版本 |
content-type | 响应正文的类型(是图片还是二进制字符串) |
Content-Length | 响应正文长度 |
Content-Charset | 响应正文使用的编码 |
Content-Encoding | 响应正文使用的数据压缩格式 |
Content-Language | 响应正文使用的语言 |
空行:响应头部的最后会有一个空行,表示响应头部结束。
响应体:服务器返回的相应HTML数据,浏览器对其解析后显示页面。
Apache网站服务基础
apache简介
"Apache HTTP Server"是开源软件项目的杰出代表,它基于标准的HTTP网络协议提供网页浏览服务,在Web服务器领域中长期保持着超过半数的份额。Apache服务器可以运行在 Linux、UNIX、Windows等多种操作系统平台中。
apache的起源
Apache服务器是针对之前出现的若干个Web服务器程序进行整合、完善后形成的软件,其名称来源于"APatchyServer",意思是"基于原有Web服务程序的代码进行修改(补丁)后形成的服务器程序"。
apache的主要特点
Apache服务器在功能、性能和安全性等方面的表现都是比比较突出的,可以较好地满足Web服务器用户的应用需求。其主要特点包括以下几个方面。
开放源代码:这是Apache服务器的重要特性之一,也是其他特性的基础。Apache服务程序由全世界的众多开发者共同维护,并且任何人人都可以自由使用,这充分体现了开源软件的精神。
跨平台应用:这个特性得益于Apache的源代码开放。Apache服务器可以运行在绝大多数软硬件平台上,所有UNIX操作系统都可以运行Apache服务器,甚至Apache服务器可以良好地运行在大多数Window:s系统平台中。Apache服务器的跨平台特性使其具有被广泛应用的条件。
支持各种Web编程语言:Apache服务器可支持的网页编程语言包括Per1、PHP、Python、Java等,甚至微软的ASP技术也可[以在Apache服务器中使用。支持各种常用的Web编程语言使Apache具有更广泛的应用领域
模块化设计:Apache并没有将所有的功能集中在单一的服务:程序内部而是尽可能地通过标准的模块实现专有的功能,这为Apache服务器带来了良好的扩展性。其他软件开发商可以编写标准的模块程序,从而添加Apache本身并不具有的其他功能。
运行非常稳定:Apache服务器可用于构建具有大负载访问量的Web站点,很多知名的企业网站都使用Apache作为Web服务软件。
良好的安全性:Apache服务器具有相对较好的安全性,这是开源软件共同具有的特性。并且,Apache的维护团队会及时对已发现的漏洞提供修补程序,为Apache的所有使用者提供尽可能安全的服务器程序。