hadoop
就叫阿坤吧
这个作者很懒,什么都没留下…
展开
-
hadoop 集群搭建
1、hadoop概述hadoop是开源的,分布式存储+分布式计算平台。hadoop可以用来搭建大型数据仓库,PB级数据的存储、处理、分析、统计等业务,具有高扩展、低成本、成熟的生态圈的特点,本文档介绍搭建hadoop的步骤,以及搭建中的注意事项。2、文档规划搭建hadoop集群需要两台虚拟机,所以有节点一,节点二,后面再动态添加一个节点。节点一节点二节点三操作系统...原创 2019-05-27 10:47:20 · 792 阅读 · 0 评论 -
hadoop 组成以及hadoop概述
文章目录1.Hadoop概述2.Hadoop生态圈3.HDFS概述3.1. 设计思想3.2. 架构解析3.2.1 namenode3.2.2 datanode3.2.3 SecondaryNamenode3.3. 架构内容3.4. 优缺点4. 核心设计4.1 心跳机制4.2 安全模式4.3 副本存放策略4.4 负载均衡5. HDFS READ(读流程)6. HDFS WRITE(写流程)7.HDF...原创 2019-05-27 11:34:55 · 340 阅读 · 0 评论 -
hadoop 初识hive
1.Hive概述hive是什么?基于Hadoop、数据仓库、结构化、类SQL、MapReduce任务架构基本组成(用户接口)CLIJDBC/ODBCWeb UI元数据存储1)元数据是什么?存储在Hive中的数据的描述信息2)有哪些?表的名、表的列和分区以及属性(内部表和外部表)、表的数据所在目录3)存在哪儿?自带Derby。缺点:不适合多用户操作,并且数据存储...原创 2019-05-27 14:18:11 · 155 阅读 · 0 评论