MapReduce保存计算结果到数据库

最新推荐文章于 2022-12-24 01:13:01 发布

白墨Blake

最新推荐文章于 2022-12-24 01:13:01 发布

阅读量792

点赞数

分类专栏：大数据

本文链接：https://blog.csdn.net/ilovehua521/article/details/101519509

版权

大数据专栏收录该内容

4 篇文章 0 订阅

订阅专栏

------------- 创建数据库和表 ---------------

mysql -u root -p 登录数据库
create database if not existsii; 创建数据库
useii; 使用数据库

create table if not exists `ii` (
	`id` int primary key auto_increment,
	`word` varchar(100) not null,
	`file_name_count` varchar(1000) not null
	);

-------------- 把 MapReduce 的输出保存到数据库 ----------

上传 mysql 的驱动到 hdfs
创建 ii 表的 model 类
也是一个内部类，
添加属性和表字段一一对应，增加 setter 和 getter 方法
让 model 类实现 Writable 和 DBWritable 两个接口
实现接口中的四个方法
在 main 中配置数据库链接信息

String driverClass = "com.mysql.jdbc.Driver";
String url = "jdbc:mysql://master:3306/book";
String username = "root";
String password = "123456aA_";

DBConfiguration.configureDB(job.getConfiguration(), driverClass, url, username, password);

加载数据库驱动

Path dbDriverPath = new Path("hdfs://master:9000/mysql-connector-java-5.1.46.jar");
job.addArchiveToClassPath(dbDriverPath);

配置输出结果保存到数据库

job.setOutputFormatClass(DBOutputFormat.class);

配置数据库表相关信息

DBOutputFormat.setOutput(job, "ii", "word", "file_name_count");

修改 reduce 的输出类型：
key = model 类型
vlaue = nullwritable 类型

修改逻辑，修改 job 中配置的 reduce 输出类型

------------- 如果不能在 windows 模拟执行，就打包放到 hadoop 执行 --------
hadoop jar xxxx 命令执行 mapReduce 程序

白墨Blake

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
MapReduce保存计算结果到数据库

------------- 创建数据库和表 ---------------mysql -u root -p 登录数据库create database if not existsii; 创建数据库useii; 使用数据库create table if not exists `ii` ( `id` int primary key auto_increment, `word` varc...
复制链接

扫一扫