- 博客(10)
- 资源 (6)
- 收藏
- 关注
转载 Hadoop中TeraSort算法分析
1TB排序通常用于衡量分布式数据处理框架的数据处理能力。Terasort是Hadoop中的的一个排序作业,在2008年,Hadoop在1TB排序基准评估中赢得第一名,耗时209秒。那么Terasort在Hadoop中是怎样实现的呢?本文主要从算法设计角度分析Terasort作业。
2011-04-27 11:46:00 852
原创 HadoopDB集群配置方法
参考此文:http://icymarywei.blog.163.com/blog/static/1275081022010116115917861/本文介绍在2个节点上安装配置HadoopDB方法。各节点的名称分别为Cluster01(192.168.0.1),Cluster02(192.168.0.2),以下若是用 hadoop@Cluster0X:~ 代表 Cluster01 ~ Cluster02 都要做的.1 首先在各节点上安装Hadoop-0.20.2,参考此文。2 各节点安裝设置 Postg
2011-04-13 16:21:00 1867 6
原创 Hadoop学习笔记汇总
初学者最好的中文入门资料。但是这个资料是针对0.18.2版本的,所以对于高版本的用户,有些地方需要注意,安装Hadoop伪分布式模式建议参考这篇文章。hadoop安装成功后,就可以开始跑一跑系统自带的WordCount实例了,参考这篇文章。
2011-04-08 17:15:00 713
原创 PostgreSQL允许远程访问设置方法
修改自:http://quicker.iteye.com/blog/571552安装PostgreSQL数据库之后,默认是只接受本地访问连接。如果想在其他主机上访问PostgreSQL数据库服务器,就需要进行相应的配置。配置远程连接PostgreSQL数据库的步骤很简单,只需要修改data目录下的pg_hba.conf和postgresql.conf,其中pg_hba.conf是用来配置对数据库的访问权限,postgresql.conf文件用来配置PostgreSQL数据库服务器的相应的参数。下
2011-04-06 19:00:00 5092
转载 Hadoop安装教程——单机(伪分布)模式
转自:http://bbs.chinacloud.cn/archiver/showtopic-589.aspxHadoop是MapReduce的开源实现,现在介绍它的单机模式安装方法。实验平台:Ubuntu 10.04,Hadoop0.20,JDK1.6
2011-04-06 18:41:00 1523
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人