- 博客(6)
- 资源 (4)
- 问答 (1)
- 收藏
- 关注
原创 Hadoop 2.7.1 集群模式安装【三】环境配置实战
基于hadoop2.7.1的详细安装,参照官方集群配置手册对hadoop进行了详细的安装配置说明。这里并没有涉及到高可用,高可用在接下来的一章中进一步详细说明
2015-12-11 13:53:31 1164
原创 Hadoop 2.7.1 集群模式安装【二】环境配置
配置守护进程参数 守护进程 环境参数 脚本文件 NameNode HADOOP_NAMENODE_OPTS hadoop-env DataNode HADOOP_DATANODE_OPTS hadoop-env Secondary NameNode HADOOP_SECONDARYNAMENODE_OPTS hadoop-env ResourceMa
2015-12-07 15:09:58 1215
翻译 Hive home【Hive文档首页】
Apache HiveApache Hive是一个建立在Apache Hadoop之上的数据仓库管理和查询软件。它提供了如下功能:对数据轻松进行ETL(extract/transform/load)的工具提供一种对各种结构数据的管理机制直接访问存储在HDFS或者其他数据存储系统之上的文件。例如Apache HBase通过查询语句执行MapReducer
2015-12-04 16:54:30 819
翻译 Hive Design【Hive 架构】
概述本文主要包含了Hive的细节设计和体系结构。 Figure 1(CSDN图太小了,建议大家放大看) Hive Architecture在图一中描述了使用Hive的主要组件和Hadoop进行交互。如图所示,Hive的主要组件包括:UI 用户提交查询和其他系统进行操作的用户接口。在2011年的时候该系统就有了一个命令行接口和一个基于GUI开发的web接口Driver - 该组件用于接收查询。
2015-12-04 13:11:43 631
Spark RDD和HDFS数据一致性问题
2016-06-04
TA创建的收藏夹 TA关注的收藏夹
TA关注的人