大数据的基本概念:大数据
(巨量数据集合(IT行业术语));大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
大数据的基本特征:
大数据的企业架构:
大数据的核心理念:分而治之,比如10TB的数据给一台机器处理,速度肯定比10TB的数据分配给10台机器处理来的慢。
Hadoop2.X的核心模块:
HDFS分布式文件系统:
HDFS文件系统
1、分布式-》主从架构:master/slaves
2、主节点和从节点
-》主节点:NameNode,管理
-》存储管理元数据(内存)
-》从节点:DataNode,执行
—》真正存储数据的,消耗的是机器上的磁盘
3、海量数据的文件存储,建立在很多的物理机器上,真正的数据仍然是在物理磁盘上的
<
1、分布式-》主从架构:master/slaves
2、主节点和从节点
-》主节点:NameNode,管理
-》存储管理元数据(内存)
-》从节点:DataNode,执行
—》真正存储数据的,消耗的是机器上的磁盘
3、海量数据的文件存储,建立在很多的物理机器上,真正的数据仍然是在物理磁盘上的
<