Kettle的导入.MySQL到HDFS

1.运行SQL语句
SET FOREIGN_KEY_CHECKS=0;
DROP TABLE IF EXISTS foundation;
CREATE TABLE foundation (
id int(11) NOT NULL AUTO_INCREMENT,
site_name varchar(255) DEFAULT NULL,
site_url varchar(255) DEFAULT NULL,
nation_s varchar(255) DEFAULT NULL,
media_flag varchar(255) DEFAULT NULL,
PRIMARY KEY (id)
) ENGINE=InnoDB AUTO_INCREMENT=9 DEFAULT CHARSET=utf8;
INSERT INTO foundation VALUES (‘5’, ‘成都日报’, ‘https://www.ned.org/’, ‘中国’, ‘新闻’);
INSERT INTO foundation VALUES (‘6’, ‘三峡晚报’, ‘https://www.ndi.org/’, ‘中国’, ‘新闻’);
INSERT INTO foundation VALUES (‘7’, ‘北京日报’, ‘https://www.iri.org/’, ‘中国’, ‘新闻’);
INSERT INTO foundation VALUES (‘8’, ‘广州日报’, ‘https://www.hrw.org/’, ‘中国’, ‘新闻’);
2.核心对象子界面
1)选择"输入",将"表输入"拖进工作区
2)选择"Big Data",将"Hadoop File Output"拖进工作区
3)按住Shift键,鼠标拖拽"表输入"图标到"Hadoop File Output"图标上,产生连线
3.表输入界面
1)数据库连接:10.4.7.16
2)SQL:SELECT id,site_name,site_url,nation_s,media_flag FROM foundation
4.Hadoop File Output界面
1)文件
Hadoop cluster:cdh
Folder/File:/baseline
扩展名:txt
结果中添加文件名:打勾
2)内容
追加方式:打勾
分隔符:\t
封闭符:"
头部:打勾
格式:DOS
压缩:None
编码:UTF-8
3)字段
名称 类型 长度
id Integer 9
site_name String 255
site_url String 255
nation_s String 255
media_flag String 255
5.运行,将MySQL,批量导入到HDFS

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值