大数据
LATASA
这个作者很懒,什么都没留下…
展开
-
大数据入门
Hadoop生态圈技术 初识Hadoop: apache下面的开源产品 通常指的是生态圈,包括HDFS,YARN,Hive 用于搭建大型数据仓库 用于PB级分布式数据存储,处理,分析,统计 存储在廉价的机器上,具有成熟的生态圈 文件系统HDFS: 将文件切分成指定大小的数据块并以多副本存储在多个机器上 Hadoop实现了一个分布式文件系统 YARN: - 负责整个集群...原创 2018-03-14 19:37:18 · 181 阅读 · 0 评论 -
分布式文件系统HDFS
HDFS HDFS官网http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-hdfs/HdfsDesign.html HDFS架构(HBase和YARN都是这种架构) 1个Master带N个Slaves,Master就是NameNode(NN),Slaves就是DataNode(DN) 1个文件会被拆分成多个Blo...原创 2018-03-20 23:03:02 · 163 阅读 · 0 评论