Hadoop
kimsho29
学习分享HADOOP生态系统
展开
-
Hadoop简介
Hadoop 2简介翻译 2016-04-09 14:51:08 · 500 阅读 · 0 评论 -
CDH 5.7.0离线安装指南
系统环境硬件环境:window下VMware 11虚拟机操作系统:红帽6.5服务器版本Cloudera Manager:5.7CDH:CDH-5.7.0-1.cdh5.7.0.p0.45-el6.parcel元数据库:Mysql 5.6参考说明http://www.cloudera.com/documentation/enterprise/latest/topics/i翻译 2016-05-08 20:47:51 · 3727 阅读 · 0 评论 -
HDFS ACLs访问控制权限
HDFS ACLs翻译 2016-05-15 18:04:39 · 5604 阅读 · 0 评论 -
CDH HUE配置自定义MySql数据库
ref:http://www.cloudera.com/documentation/enterprise/latest/topics/cm_ig_mysql.html#cmig_topic_5_5For information about installing and configuring a MySQL database , see MySQL Database.I转载 2016-05-28 18:20:47 · 6215 阅读 · 0 评论 -
MapReduce框架在Yarn上的详解
MapReduce任务解析在YARN上一个MapReduce任务叫做一个Job。一个Job的主程序在MapReduce框架上实现的应用名称叫MRAppMaster.MapReduce任务的Timeline这是一个MapReduce作业执行时间:Map 阶段:根据数据块会执行多个Map TaskReduce 阶段:根据配置项会执行多个Reduce Task翻译 2016-04-11 23:04:30 · 3678 阅读 · 0 评论 -
Hive on Spark配置总结
Hive on spark原创 2016-06-04 14:13:11 · 7407 阅读 · 0 评论 -
R通过RJDBC连接外部数据库
转载自:http://blog.csdn.net/faith_mo_blog/article/details/412456331、 连接hivelibrary(RJDBC)drvHadoop/impala-jdbc-0.5.2”,pattern=”jar$”,full.names=TRUE,recursive=TRUE))conn2、 连接MySQL转载 2016-06-26 10:25:30 · 3585 阅读 · 1 评论 -
Spark在Yarn上的动态资源分配
参考地址:http://spark.apache.org/docs/1.5.2/job-scheduling.html#configuration-and-setup1.配置hadoop/etc/yarn-site.xml yarn.nodemanager.aux-services mapreduce_shuffle,spark_shuffle yar原创 2016-09-20 11:18:35 · 2377 阅读 · 0 评论