Sqoop官网:
http://sqoop.apache.org/
*) Sqoop介绍
Sqoop用来在Hadoop和关系数据库中传递数据。通过sqoop,我们可以方便的将数据从关系数据库导入到HDFS,或者将数据从HDFS导出到关系数据库。
参考链接:
http://blog.csdn.net/yfkiss/article/details/8700480
*) 简单的sample案例
目标: 把oracle中全表数据导入到hdfs文件系统中
1) 在Oracle中添加如下表:
CREATE TABLE tb_message
(
ID INT PRIMARY KEY,
MSGID INT,
MESSAGE VARCHAR(256)
);
2). 添加如下数据:
INSERT INTO tb_message(ID, MSGID, MESSAGE) VALUES(1, 1001, 'message 1');
INSERT INTO tb_message(ID, MSGID, MESSAGE) VALUES(2, 1002, 'message 2');
INSERT INTO tb_message(ID, MSGID, MESSAGE) VALUES(3, 1003, NULL);
3). 数据验证
SELECT * FROM tb_message;
IDMSGIDMESSAGE
---------- -------------------------------------
1 1001message 1
2 1002mess