1.运行SQL语句
SET FOREIGN_KEY_CHECKS=0;
DROP TABLE IF EXISTS foundation
;
CREATE TABLE foundation
(
id
int(11) NOT NULL AUTO_INCREMENT,
site_name
varchar(255) DEFAULT NULL,
site_url
varchar(255) DEFAULT NULL,
nation_s
varchar(255) DEFAULT NULL,
media_flag
varchar(255) DEFAULT NULL,
PRIMARY KEY (id
)
) ENGINE=InnoDB AUTO_INCREMENT=9 DEFAULT CHARSET=utf8;
INSERT INTO foundation
VALUES (‘5’, ‘成都日报’, ‘https://www.ned.org/’, ‘中国’, ‘新闻’);
INSERT INTO foundation
VALUES (‘6’, ‘三峡晚报’, ‘https://www.ndi.org/’, ‘中国’, ‘新闻’);
INSERT INTO foundation
VALUES (‘7’, ‘北京日报’, ‘https://www.iri.org/’, ‘中国’, ‘新闻’);
INSERT INTO foundation
VALUES (‘8’, ‘广州日报’, ‘https://www.hrw.org/’, ‘中国’, ‘新闻’);
2.核心对象子界面
1)选择"输入",将"表输入"拖进工作区
2)选择"Big Data",将"Hadoop File Output"拖进工作区
3)按住Shift键,鼠标拖拽"表输入"图标到"Hadoop File Output"图标上,产生连线
3.表输入界面
1)数据库连接:10.4.7.16
2)SQL:SELECT id,site_name,site_url,nation_s,media_flag FROM foundation
4.Hadoop File Output界面
1)文件
Hadoop cluster:cdh
Folder/File:/baseline
扩展名:txt
结果中添加文件名:打勾
2)内容
追加方式:打勾
分隔符:\t
封闭符:"
头部:打勾
格式:DOS
压缩:None
编码:UTF-8
3)字段
名称 类型 长度
id Integer 9
site_name String 255
site_url String 255
nation_s String 255
media_flag String 255
5.运行,将MySQL,批量导入到HDFS