Hadoop的文件系统主要来自google File System :GFS
一、什么是大数据,本质?
1、数据的存储:分布式文件系统(分布式存储)----------------------->HDFS:Hadoop Distrisbuted File System
2、数据的计算:分布式计算
二、如何解决大数据的存储?-------------->分布式文件系统(HDFS,来源于CFS)
1、CFS:没有硬盘的,数据只能存在内存中
2、hadoop的安装模式:
举例子:
(*)本地模式:1台
(*)伪分布模式:1台
(*)全分布模式:3台
1、什么是RageRank(MapReduce的问题的来源)
(*)搜索排名
举例:
2、MapReduce基础编程模型
举例
BigTable------------------->大表-------------------->NoSQL数据库:HBase
1、关系型数据库(Oracle、Mysql,SQL Server)的特点
1、什么是关系型数据库?基于关系模型(基于二维模型)所提出的一种数据库
2、ER(Entity-Relationalship)模型:通过增加外键来减少数据冗余
举例:
2、什么是BigTable?把所有数据保存在一张表中,采用冗余------------------>好处:提高效率
1、因为有了bigtable的死刑:NoSQL:HBase数据库
2、HBase基于Hadoop的HDFS
3、描述HBase的表结构
举例: