Hadoop一共分为三部分
1.大数据存储HDFS
2.大数据分析计算MapReduce
3.大数据管理 HBASE
HDFS 大数据存储。是指被设计成适合运行在通用硬件上的分布式文件系统它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。
MapReduce,大数据分析计算。MapReduce是一种编程模型,用于大数据,的并行运算。它极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在分布式系统上。
HBASE 大数据管理。是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBase基于列的而不是基于行的模式。
以上是我对Hadoop系统的认识。
![在这里插入图片描述](https://img-blog.csdnimg.cn/20201114163424776.jpg?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzUyMDAwNTY4,size_16,color_FFFFFF,t_70)