MongoDB+Hadoop运行环境搭建

首先要下载mongo-hadoop adapter


git clone https://github.com/mongodb/mongo-hadoop.git

git checkout release-1.0


然后进入mongo-hadoop目录,找到build.sbt将 hadoopRelease in ThisBuild 修改成如下所示:


hadoopRelease in ThisBuild := "0.20"


然后运行 ./sbt package(关于sbt https://github.com/harrah/xsbt/wiki)

运行时需要FQ才行。

运行结束之后会再core/target目录下生成一个jar文件mongo-hadoop-core_0.20.205.0-1.0.1.jar,然后下载mongodb的驱动包。


wget --no-check-certificate https://github.com/downloads/mongodb/mongo-java-driver/mongo-2.7.3.jar  下载完之后就可以开始开发mongo-hadoop的程序了。 
运行自带示例: 首先将数据导入到mongodb中,命令如下。  
./sbt load-sample-data 
然后再eclipe中新建一个项目,例如treasury,将mongo-hadoop/example/treasury_field中的源文件和资源文件复制到新建的项目下。
如图所示: 

然后修改mongo-treasury_yield.xml文件中mongodb的url和存放collection

< property >
<!--  If you are reading from mongo, the URI  -->
< name >mongo.input.uri </ name >
< value >mongodb://127.0.0.1/mongo_hadoop.yield_historical.in </ value >
</ property >
< property >
<!--  If you are writing to mongo, the URI  -->
< name >mongo.output.uri </ name >
< value >mongodb://127.0.0.1/mongo_hadoop.yield_historical.out </ value >
</ property >

 

然后修改TreasuryYieldXMLConfig.java如下:

Configuration.addDefaultResource( "resources/mongo-treasury_yield.xml");
Configuration.addDefaultResource( "resources/mongo-defaults.xml" );

 

后将项目打包成jar文件。

运行 hadoop jar treasury.jar com.mongodb.hadoop.treasury.TreasuryXMLConfig 即可运行hadoop程序。运行结果如下图:mongodb中的数据。



posted on 2012-10-13 11:28 NNS 阅读( ...) 评论( ...) 编辑 收藏

转载于:https://www.cnblogs.com/hitandrew/archive/2012/10/13/2722400.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值