第二章 大数据技术概述
2.1 大数据技术的产生
2005年Hadoop项目诞生。 Hadoop其最初只是雅虎公司用来解决网页搜索问题的一个项目,后来因其技术的高效性,被Apache Software Foundation公司引入并成为开源应用。
Hadoop本身不是一个产品,而是由多个软件产品组成的一个生态系统,这些软件产品共同实现全面功能和灵活的大数据分析。从技术上看,Hadoop由两项关键服务构成:采用Hadoop分布式文件系统(HDFS)的可靠数据存储服务,以及利用一种叫做MapReduce技术的高性能并行数据处理服务。这两项服务的共同目标是,提供一个使对结构化和复杂数据的快速、可靠分析变为现实的基础。
2.1.1大数据的基本概念
大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据的4V特点:Volume、Velocity、Variety、Veracity。
大数据技术的产生首先源于互联网企业对于日益增长的网络数据分析的需求。
2.大数据的可用性及衍生价值
进入IT时代以来,全人类积累了海量的数据,这些数据仍在不断急速增加,这带来两个方面的巨变:一方面,在过去没有海量的数据积累的时代无法实现的应用现在终于实现。
2.1.2大数据产生的原因
1.大数据的产生
大数据技术的产生首先源于互联网企业对于日益增长的网络数据分析的需求,20世纪80年代的典型代表市Yahoo的“分类目录”搜索数据库;20世纪90年代的典型代表市Google,它开始运用算数分析用户的实际需求,而且创造新的需求。因为此时Web2.0的出现使人们从信息的被动接收者变成了主动创造者。
基于上述状况2006年ÿ
第二章 大数据技术概述(1)
最新推荐文章于 2023-06-29 11:37:32 发布