「SequoiaDB巨杉数据库」Hadoop集成

最新推荐文章于 2024-07-26 09:40:31 发布

 WooJin-Park

最新推荐文章于 2024-07-26 09:40:31 发布

阅读量101

点赞数

分类专栏： sequoiadb 文章标签：数据库

原文链接：http://doc.sequoiadb.com/cn/sequoiadb-cat_id-1561382413-edition_id-500

版权

sequoiadb 专栏收录该内容

119 篇文章 0 订阅

订阅专栏

搭建 Hadoop 环境

巨杉数据库支持 hadoop 1.x 和 hadoop 2.x。先安装配置好 Hadoop。

配置连接环境

与 MapReduce 对接，需要准备 hadoop-connector.jar 和 sequoiadb.jar，用户可以在 SequoiaDB 安装目录下面的 hadoop 目录（默认为/opt/sequoiadb/hadoop）中找到这两个jar包。

运行

$ hadoop classpath

查看 hadoop 的 classpath。在 classpath 中选择一个目录，把 hadoop-connector.jar 和 sequoiadb.jar 放在目录里面，重启 hadoop 集群。

编写 MapReduce

hadoop-connector.jar 中一些重要的类：

SequoiadbInputFormat：读取SequoiaDB的数据。

SequoiadbOutputFormat：向SequoiaDB写入数据。

BSONWritable：BSONObject 的包装类，实现了 WritableComparable 接口。用于序列化 BSONObject 对象。

SequoiaDB 和 MapReduce 的配置：

sequoiadb-hadoop.xml 是配置文件，放在你编写的 MapReduce 工程的源码根目录下面。

sequoiadb.input.url：指定作为输入源 SequoiaDB 的 URL 路径，格式为：hostname1:port1,hostname2:port2。

sequoiadb.input.user：指定输入源 SequoiaDB 的用户名，默认为 null。

sequoiadb.input.passwd：指定输入源 SequoiaDB 用户密码，默认为 null。

sequoiadb.in.collectionspace：指定作为输入源 SequoiaDB 集合空间。

sequoiadb.in.collection：指定作为输入源 SequoiaDB 集合。

sequoiadb.query.json：指定输入源 SequoiaDB 的查询条件，使用 json 结构，默认为 null。

sequoiadb.selector.json：指定输入源 SequoiaDB 的字段筛选，使用 json 结构，默认为 null。

sequoiadb.preferedinstance：指定从输入源 SequoiaDB 中获取数据时，连接哪个数据节点，默认为 anyone，可填值：[slave/master/anyone/node(1-7)]。

sequoiadb.output.url：指定作为输出源 SequoiaDB 的 URL 路径。

sequoiadb.output.user：指定输出源 SequoiaDB 用户名，默认为 null。

sequoiadb.output.passwd：指定输出源 SequoiaDB 用户密码，默认为 null。

sequoiadb.out.collectionspace：指定作为输出源 SequoiaDB 的集合空间。

sequoiadb.out.collection：指定作为输出源 SequoiaDB 的集合。

sequoiadb.out.bulknum：指定每次向输出源 SequoiaDB 写入的记录条数，对写入性能进行优化。

更多参考内容请点击

 WooJin-Park

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
「SequoiaDB巨杉数据库」Hadoop集成

搭建 Hadoop 环境巨杉数据库支持 hadoop 1.x 和 hadoop 2.x。先安装配置好 Hadoop。配置连接环境与 MapReduce 对接，需要准备 hadoop-connector.jar 和 sequoiadb.jar，用户可以在 SequoiaDB 安装目录下面的 hadoop 目录（默认为/opt/sequoiadb/hadoop）中找到这两个jar包。运行$ hadoop classpath查看 hadoop 的 classpath。在 class.
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。