大数据笔记15:大数据概述

第15天——大数据概述


一、Zebra项目缺点
二、大数据概述
1、大数据时代
2、大数据概念
3、大数据的影响
4、大数据的应用
5、大数据关键技术
6、大数据计算模式
7、大数据产业
8、大数据与云计算、物联网的关系


一、Zebra项目缺点
1、没有涉及到大数据的处理和管理问题
2、没有数据备份,可能会有数据丢失的可能
3、没有采用计算框架的思想来处理,比如逻辑切块、文件位置追溯等可以提炼到框架里,以后再遇到相同业务逻辑时,直接使用可提高开发效率
4、zebra项目的任务分配是粗粒度的任务分布,应该做到资源级别的封装(比如CPU、带宽等)的封装。

二、大数据概述
1、大数据时代
(1)第三次信息化浪潮
根据IBM前首席执行官郭士纳的观点,IT领域每隔十五年就会迎来一次重大变革。
(2)信息科技为大数据时代提供技术支撑
A. 存储设备容量不断增加
B. CPU处理能力大幅提升
C. 网络带宽不断增加

(3)数据产生方式的变革促成大数据时代的来临

GB(10^9)——TB(10^12)——PB(10^16)——EB(10^19)——ZB(10^21)——YB(10^24)——BB(10^27)——NB(10^30)——DB(10^33)——CB(10^36)

(4)大数据的发展历程

2、大数据概念
(1)数据量大
  • 根据IDC作出的估测,数据一直都在以每年50%的速度增长,也就是说每两年就增长一倍(大数据摩尔定律)
  • 人类在最近两年产生的数据量相当于之前产生的全部数据量
  • 预计到2020年,全球将总共拥有35ZB的数据量,相较于2010年,数据量将增长近30倍
(2)数据类型繁多
大数据是由结构化和非结构化数据组成的
– 10%的结构化数据,存储在数据库中
– 90%的非结构化数据,它们与人类信息密切相关

(3)处理速度快
从数据的生成到消耗,时间窗口非常小,可用于生成决策的时间非常少
1秒定律:这一点也是和传统的数据挖掘技术有着本质的不同

(4)价值密度低
价值密度低,商业价值高。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒,但是具有很高的商业价值。




3、大数据的影响
图灵奖获得者、著名数据库专家Jim Gray 博士观察并总结人类自古以来,在科学研究上,先后历经了实验、理论、计算和数据四种范式。
(1)在思维方式方面,大数据完全颠覆了传统的思维方式
  • 全样而非抽样
  • 效率而非精确
  • 相关而非因果
(2)在社会发展方面,大数据决策逐渐成为一种新的决策方式,大数据应用有力促进了信息技术与各行业的深度融合,大数据开发大大推动了新技术和新应用的不断涌现
(3)在就业市场方面,大数据的兴起使得数据科学家成为热门职业
(4)在人才培养方面,大数据的兴起,将在很大程度上改变中国高校信息技术相关专业的现有教学和科研体制

4、大数据的应用
大数据无处不在,包括金融、汽车、零售、餐饮、电信、能源、政务、医疗、体育、娱乐等在内的社会各行各业都已经融入了大数据的印迹。
典型的大数据应用实例:


5、大数据关键技术

6、大数据计算模式

7、大数据产业
大数据产业是指一切与支撑大数据组织管理和价值发现相关的企业经济活动的集合。
8、大数据与云计算、物联网的关系
云计算、大数据和物联网代表了IT领域最新的技术发展趋势,三者相辅相成,既有联系又有区别。
(1)云计算
A. 云计算概念
云计算实现了通过网络提供可伸缩的、廉价的分布式计算能力,用户只需要在具备网络接入条件的地方,就可以随时随地获得所需的各种IT资源。

云计算服务模式与类型:

B. 云计算关键技术
云计算关键技术包括:虚拟化、分布式存储、分布式计算、多租户等
C. 云计算数据中心
  • 云计算数据中心是一整套复杂的设施,包括刀片服务器、宽带网络连接、环境控制设备、监控设备以及各种安全装置等
  • 数据中心是云计算的重要载体,为云计算提供计算、存储、带宽等各种硬件资源,为各种平台和应用提供运行支撑环境
  • 全国各地推进数据中心建设
D. 云计算应用
  • 政务云上可以部署公共安全管理、容灾备份、城市管理、应急管理、智能交通、社会保障等应用,通过集约化建设、管理和运行,可以实现信息资源整合和政务资源共享,推动政务管理创新,加快向服务型政府转型
  • 教育云可以有效整合幼儿教育、中小学教育、高等教育以及继续教育等优质教育资源,逐步实现教育信息共享、教育资源共享及教育资源深度挖掘等目标
  • 中小企业云能够让企业以低廉的成本建立财务、供应链、客户关系等管理应用系统,大大降低企业信息化门槛,迅速提升企业信息化水平,增强企业市场竞争力
  • 医疗云可以推动医院与医院、医院与社区、医院与急救中心、医院与家庭之间的服务共享,并形成一套全新的医疗健康服务系统,从而有效地提高医疗保健的质量
E. 云计算产业
云计算产业作为战略性新兴产业,近些年得到了迅速发展,形成了成熟的产业链结构,产业涵盖硬件与设备制造、基础设施运营、软件与解决方案供应商、基础设施即服务(IaaS)、平台即服务(PaaS)、软件即服务(SaaS)、终端设备、云安全、云计算交付/咨询/认证等环节。

(2)物联网
A. 物联网概念
物联网是物物相连的互联网,是互联网的延伸,它利用局部网络或互联网等通信技术把传感器、控制器、机器、人员和物等通过新的方式联在一起,形成人与物、物与物相联,实现信息化和远程管理控制。

B. 物联网关键技术
物联网中的关键技术包括识别和感知技术(二维码、RFID、传感器
等)、网络与通信技术、数据挖掘与融合技术等。
C. 物联网应用
物联网已经广泛应用于智能交通、智慧医疗、智能家居、环保监测、智能安防、智能物流、智能电网、智慧农业、智能工业等领域,对国民经济与社会发展起到了重要的推动作用。
D. 物联网产业
完整的物联网产业链主要包括核心感应器件提供商、感知层末端设备提供商、网络提供商、软件与行业解决方案提供商、系统集成商、运营及服务提供商等六大环节。

(3)大数据与云计算、物联网的关系
云计算、大数据和物联网代表了IT领域最新的技术发展趋势,三者既有区别又有联系。


阅读更多
换一批

没有更多推荐了,返回首页