1.1大数据
-
大数据的定义:在一定时间范围内用常规软件工具进行捕捉、管理和处理数据集合。
-
经典案例:(1)啤酒与尿布
-
谷歌与流感
-
大数据的范围:采集、存储、搜索、共享、传输、分析和可视化。
-
内存:运行速度。
-
存储:储存容量。
-
海量数据产生:(1)来自大人群互联网
(2)来自大量传感器机械
(3)科学研究及行业多结构专业数据
- 1887—1890年:电功器
1994年:预见大数据
1997年:用大数据描述超级计算机产生的大量信息。
2003—2006年:谷歌提出大数据可重用方案。
2008年:提出大数据概念。
2009年:大数据逐渐走进互联网。
2012年:大数据成为一种新的资产类别。
2013年:大数据元年
- 1ZB=10亿TB
各数据量单位:KB>MB>GB>TB>PB>EB>ZB>YB>NB>DB
单位以PB衡量的数据可称为大数据。
1字节(8位)→1个英文字母或二进制8位数
1文字=2字节=16位
1.2第四范式
实验(第一范式)→理论(第二范式)→计算(第三范式)→数据(第四范式)
存储量大
大量化
增量大
来源多搜索引擎
- 大数据的特征多样化社交网络
格式多结构化数据
非结构化数据
快速化
有价值
- 企业推动大数据
1.3大数据的关键技术
一.大数据预处理技术:数据采集数据存取基础架构支持计算结果展示
二.大数据存储技术:储存设备能持久可靠的的存储数据提供可伸缩接口提供高效查询,更新等操作
三.大数据分析技术:数据处理统计和分析数据挖掘模型预测
1.4大数据的典型计算架构
Haddop(处理本地数据)Spark(收集并更新)Storm(延迟毫秒级)
云计算概述:无处不在的云计算比如电子日历,电子导航,钉钉等
什么是云计算?像水,电,煤(资源性产品)一样利用你的it资源(计算机储存网络资源)
关键词:按需使用,超大规模,高弹性
定义:指按需使用it资源和应用程序,通过互联网按使用量付费。
四种云:
- 公有云:提供公共的it资源缺点:保密性低
- 私有云:提供给政府,学校等地优点:保密性高
- 社区云:研究人员使用
- 混合云:包含以上任意两种
生活中的例子:
- 出行论:自己买车开车(混合云)
- 吃饭论:餐厅(公有云)在家做饭(私有云)
- 酒店论:酒店(公有云)家(私有云)
2.1云计算的基本特征
- 资源无限量供应
- 提供自助式服务
- 远程提供服务
- 资源可控
- 按使用量付费
2.2云计算的发展背景
1.20世纪60年代,计算机革命
2.20世纪90年代,互联网革命
1994年weblo(单向传递)
2004年weblo(双向传递)
3.2010年,移动互联网革命
2.4云计算模下的it建设
特点:
- 开放硬件平台,软件与硬件解藕
- it建设的传统ioe架构转向互联网架构
- 分布式设计软件定义储存
- 集中资源池的共享,虚拟化,分时共享
- 动态调配,弹性伸缩,低成本,标准化硬件
- 芯片新介质取得突破(云计算it的基础)
优点:省时省力省电省钱省人省地
2.5云计算的特点
- 虚拟化技术
- 动态可扩展性
- 按需部署
- 灵活性高
- 可靠性高
- 性价比高
- 地理分布
- 先进安全技术
2.6云计算的主要服务模式
IaaS第一层
SaaS第二层
PaaS第三层
Iaas(基础设施即服务)(租用)关键技术:虚拟化技术
SaaS(平台即服务)(编程)数据库服务web应用
特点:1.简化开发人员
- 提供pc端或软件端的开发套件
- 丰富的开发环境
- 完全可托管的数据化服务
- 可配置式的应用程序的构建
- 支持多语言的开发
- 面向市场
关键技术:1.分布式并计算2.分布式储存
-
SaaS(软件即服务)(用户)关键技术:多租户技术
-
三种服务的区别
-
IaaS(最低层)提供基础设施服务
-
PaaS(提供软件)部署平台
-
SaaS(拿来即用)例如:云计算服务=做饭做餐
云计算服务商=饭店
IaaS=提供厨房,锅具等
不提供食材和技术
PAAS提供厨房切好的食材
不提供技术
SaaS提供厨房,食材,技术
IaaS租车
PaaS租车+司机
SaaS坐公交
三虚拟化技术
- 什么是虚拟化?
作为一种计算机资源管理技术将各种的工厂实体资源抽象的转化为另一种形式的技术
- 云计算与虚拟化有什么关系?
云计算1.0 以虚拟化为核心
云计算2.0 以资源为核心
云计算3.0 以应用为核心
云计算:一种服务
虚拟化:一种技术基础
物理机:
- 操作系统:Host,OS
- 硬件:Host,Machine
虚拟机:
-
操作系统:Guest,OS
-
虚拟机:Guest,Machine
-
VMM(虚拟监控器)
-
硬件:Host,Machine
-
虚拟化的特点
-
区分可分为多个虚拟机
-
隔离虚拟机与虚拟机之间相互独立
-
封装独立的文件夹形式
-
相对于硬件独立屏蔽底层硬件不兼容问题
-
虚拟化类型
一.寄居虚拟化:在主操作系统上安装和运行的一个程序
特点:(1)简单易于实现
- 安装和运行应用程序时依赖于主操作系统对设备的支持
- 有两层OS管理开销大性能损耗大
- 虚拟机对各种物理主机的调用都是通过虚拟化层和宿主OS一起调用完成
- 裸金属虚拟化在硬件上部署虚拟化层
特点:
- 不依赖于操作系统
- 支持多种操作系统
- 依赖虚拟层内核和服务控制台进行管理
- 需要对虚拟层进行内核开发
- 混合虚拟化插入内核模块
特点
-
相对于寄居虚拟化性能高
-
相对于裸金属虚拟化不需要内核开发
-
支持多种操作系统
-
需要底层硬件支持虚拟扩展功能
-
虚拟化层构架:
全虚拟化(KVM),半虚拟化(Xen),硬件辅助虚拟化
- .全虚拟化:
即所抽象的VM具有完全的物理特性虚拟化层负责捕获CPU指令,为指令访问硬件充当媒介
特点:OS无需修改速度和功能比较好使用非常简单移植性好
- 半虚拟化:
特点:架构更简单对OS进行修改用户体验比较麻烦速度上占一定优势
7.虚拟化技术的优势和劣势
优势:减少物理资源的投入节约成本
虚拟化数据资源迁移方便
提高物理资源的使用率
高价环保节省能源
易于自动化维护与操作减少维护成本
数据安全更有保障
劣势:目前此界没有统一的虚拟化技术标准平台没有开放的协议
如果没有对数据进行备份用虚拟化技术会存在一定的风险
虚拟化数据中心的迁移特别是对在线服务的迁移对用户影响巨大
- 全虚拟化与半虚拟化举例对比
KVM(性能)Xen(安全)
全虚拟化半虚拟化
内置在内核中需要修改内核
便于版本安装升级维护更新版本重新编辑整个内核
性能高隔离好