- 博客(3)
- 收藏
- 关注
原创 记录下Ganglia本地测试环境的搭建
Hadoop和HBase本身对于Ganglia的支持非常好。通过简单的配置,我们可以将Hadoop和HBase的一些关键参数以图表的形式展现在Ganglia的Web Console上。这些对于我们洞悉Hadoop和HBase的内部系统状态有很大的帮助,我本地环境是unubtu12.041. 准备安装依赖:apt-get install rrdtool apache2 php52...
2013-10-12 14:14:01
93
原创 hadoop中使用MapReduce编程实例
最近在做HADOOP的研发 发现了一篇非常的博文 赶紧收藏!对于MapReuce的编程思想介绍的徐徐渐进!原文链接:http://www.cnblogs.com/xia520pi/archive/2012/06/04/2534533.html 1、数据去重 "数据去重"主要是为了掌握和利用并行化思想来对数据进行有意义的筛选。统计大数据集上的数据种类个数、从网站日志中计算...
2013-07-09 13:14:29
105
原创 Programing Hive读书笔记
we said that Hive really has no control over the integrity of the files used for storage and whether or not their contents are consistent with the table schema. Even managed tables don’t give ...
2013-06-19 10:23:22
101
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人