RHadoop
文章平均质量分 78
RoQuant
一个量化投资爱好者
展开
-
Hadoop及RHadoop的初步尝试
http://chen.yi.bo.blog.163.com/blog/static/1506211092012720111910827/跑步归来写个日记。最近在学习Hadoop的使用,起初是写一点Hive的统计脚本,后来觉得不了解Hadoop的机制就没办法对脚本做优化,所以就硬着头皮开始学习。众所周知我是个计算机小白,直接上集群操作的话总担心把机器搞坏掉,于是我就冒着较小的风险把我工作电脑的转载 2015-12-15 10:48:03 · 1118 阅读 · 0 评论 -
Hive与HBase的区别
Hive是为了简化编写MapReduce程序而生的,使用MapReduce做过数据分析的人都知道,很多分析程序除业务逻辑不同外,程序流程基本一样。在这种情况下,就需要Hive这样的用戶编程接口。Hive本身不存储和计算数据,它完全依赖于HDFS和MapReduce,Hive中的表纯逻辑,就是些表的定义等,也就是表的元数据。使用SQL实现Hive是因为SQL大家都熟悉,转换成本低,类似作用的Pig就转载 2015-12-15 11:27:28 · 466 阅读 · 0 评论 -
Step-by-Step Guide to Setting Up an R-Hadoop System
This is a step-by-step guide to setting up an R-Hadoop system. I have tested it both on a single computer and on a cluster of computers. Note that this process is for Mac OS X and some steps or sett转载 2015-12-15 14:48:45 · 560 阅读 · 0 评论