MapReduce同时写入HBase,HDFS

最新推荐文章于 2021-12-01 10:49:26 发布

SimpleIsBetter

最新推荐文章于 2021-12-01 10:49:26 发布

阅读量1.1k

点赞数

分类专栏： MapReduce 文章标签： mapreduce

本文链接：https://blog.csdn.net/yhmabcdef/article/details/53976429

版权

MapReduce 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

MapReduce同时写入HBase HDFS

1，job设置：

job.setOutputFormatClass(org.apache.hadoop.hbase.mapreduce.TableOutputFormat.class);

job.getConfiguration().set(TableOutputFormat.OUTPUT_TABLE, ${hbase表名});

多输出设置

MultipleOutputs.addNamedOutput(job, "hdfs", TextOutputFormat.class, WritableComparable.class, Writable.class);

2，reduce

private MultipleOutputs mos;

@Override

protected void setup(Context context) throws IOException, InterruptedException {

mos = new MultipleOutputs(context);

}

@Override

public void reduce(Text userID, Iterable<Text> itemIDs, Context context) throws IOException, InterruptedException {

Put put = new Put(${rowKey}.getBytes());

//存储key值下不同日期的value值 @param(row, qualifier, value)

put.add(new KeyValue(${rowKey}.getBytes(), "date".getBytes(), ${日期}.getBytes(), ${value}.getBytes()));

context.write(new ImmutableBytesWritable(${rowKey}.getBytes()), put);

//写入HDFS

mos.write("hdfs", ${key}, ${value}, ${hdfspath});

}

@Override

protected void cleanup(Context context) throws IOException, InterruptedException {

mos.close();

}

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

SimpleIsBetter

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

用MapReduce把hdfs数据写入HBase中

Java海洋

03-01

5505

1.使用Map+Reduce方式 public class MapReduceImport { /** * Mapper */ static class HMapper extends MapperLongWritable, Text, LongWritable, Text> { Text v2 = new Text();

JAVA将HDFS中的文件导入HBase

05-01

参与评论您还未登录，请先登录后发表或查看评论

hdfs数据写入hbase

AntKengElephant的博客

09-30

457

数据类型： aaa,123 bbb,234 ccc,345 hbase中第一列作为rowkey，第二列作为value package cn.xlzx.hbase; import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseCo...

MapReduce(十六): 写数据到HDFS的源码分析

dickens的专栏

09-02

1042

对写数据到HDFS的源码分析

mapreduce将hdfs数据存入hbase-2.3.0

PYJcsdn的博客

07-16

366

<dependency> <groupId>org.apache.hbase</groupId> <artifactId>hbase-client</artifactId> <version>2.3.0</version> </dependency> <dependency> <groupId>org.apache.hbase</groupId&gt.

mapreduce写入HBase，数据异常

小透明-溶冰

04-01

817

写入HBase的数据不对如读入的数据是 Hello Hadoop Hadoop is easy 存入数据库就成了 Hellop Hadoop isllop easy public class WordCountReducerHbase extends TableReducer ImmutableBytesW

mapreduce HDFS 写入hbase 表中

servletwjx的博客

03-29

217

import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.Path; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.client.Put; import org.apache.hadoop....

parquet 形式MapReduce hbase 数据写入hdfs

servletwjx的博客

05-28

495

package com.sitech; import com.google.common.collect.Lists; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.Path; import org.apache.h...

【HBase基础教程】6、HBase之读取MapReduce数据写入HBase

andieguo的专栏

03-05

8690

本blog将介绍利用MapReduce操作HBase，借助最熟悉的单词计数案例WordCount，将WordCount的统计结果存储到HBase，而不是HDFS。开发环境硬件环境：Centos 6.5 服务器4台（一台为Master节点，三台为Slave节点）软件环境：Java 1.7.0_45、Eclipse Juno Service Release 2、hadoop-1.2.1、hbase-

HDFS 通过mapreduce 进行 HBase 导入导出

08-07

标题 "HDFS 通过 mapreduce 进行 HBase 导入导出" 涉及的是大数据处理领域中的两个重要组件——Hadoop Distributed File System (HDFS) 和 HBase，以及它们之间的数据交互。HDFS 是 Hadoop 的分布式文件系统，而 ...

HBase学习之路（五）MapReduce操作Hbase

weixin_33924312的博客

04-02

MapReduce从HDFS读取数据存储到HBase中现有HDFS中有一个student.txt文件，格式如下 95002,刘晨,女,19,IS 95017,王风娟,女,18,IS 95018,王一,女,19,IS 95013,冯伟,男,21,CS 95014,王小丽,女,19,CS 95019,邢小丽,女,19,IS 95020,赵钱,男,21,IS 95003,王敏,女...

mapreduce输出数据存入HBase中

鲍礼彬的CSDN博客 ~_~

05-27

3699

数据格式： 1363157985066 13726230503 00-FD-07-A4-72-B8:CMCC 120.196.100.82 i02.c.aliimg.com 24 27 2481 24681 200 事先在HBase里把表创建好： create 'mr_hbases','cf' 代码如下： package mrhbase; import java.i

通过Map/Reduce将HDFS数据写入ES，ES数据写入HDFS

weixin_36340771的博客

12-01

2401

环境准备系统 centos 7 java 1.8 hadoop 2.7 ES 7.15.2 （ES单机版本安装可以参考：https://blog.csdn.net/weixin_36340771/article/details/121389741）准备hadoop本地运行环境获得Hadoop文件链接：https://pan.baidu.com/s/1MGriraZ8ekvzsJyWdPssrw 提取码：u4uc 配置HADOOP_HOME 解压上述文件，然后配置HADOOP_HOME，注意修改地址。

HBase与MapReduce的集成（读取HDFS文件，写入到HBase表当中去）

最慢的步伐不是跬步，而是徘徊；最快的脚步不是冲刺，而是坚持

12-20

6982

需求：读取HDFS文件，写入到HBase表当中去读取hdfs路径/hbase/input/user.txt内容如下 0007 zhangsan 18 0008 lisi 25 0009 wangwu 20 第一步：准备数据文件准备数据文件，并将数据文件上传到HDFS上面去 hadoop fs -mkdir -p /hbase/inp...

第九第十 hdfs的读写流程&mapreduce流程入门

weixin_43056275的博客

07-14

730

课堂学习笔记第九天课程：课程大纲HDFS 工作机制--上传文件写数据流程HDFS 工作机制--下载文件读数据流程HDFS 工作机制--nn dn核心概述HDFS java操作--开发环境构建--FileSystem类HDFS java操作--注意身份&注意winUtilsexeHDFS java操作--更加底层Stream的形式访问HDFS 案例--了解shell采集数据到hdfs 第九天...

MapReduce程序的工作过程

小海森的博客

10-03

767

还记得2.5年前就搭建好了Hadoop伪分布式集群，安装好Eclipse后运行成功了WordCount.java，然后学习Hadoop的步伐就变得很慢了，相信有很多小伙伴和我一样。自己对MR程序（特指Hadoop 1.x版本）的工作过程一直都不是很清楚，现在重点总结一下，为MR编程打好基础。由于MapReduce是基于HDFS的操作，因此要想深入理解MapReduce（解决的是分布式计算问题），首

HDFS+MapReduce（超级详细）

qq_43521665的博客

06-16

2623

问：分布式文件系统这么多,为什么Hadoop还要开发hdfs? 答：更好的实现分布式计算首先数据移动的成本很高，所以将计算向数据移动主从式结构，只设置一个主节点，因为保持数据一致性比较麻烦在现代的企业环境中，单机容量往往无法存储大量数据，需要跨机器存储。统一管理分布在集群上的文件系统称为分布式文件系统。 HDFS 使用多台计算机存储文件，并且提供统一的访问接口，像是访问一个普通文件系统一样使用分布式文件系统。理解偏移量offset:8个字节文件，块为4个字节。那第一个块的偏移量为0，.

MapReduce中实现对HBase中表的操作二

在路上的学习者

02-26

5027

1.从hbase中读取数据 2. 写map\reduce过程 3. 输出数据到hdfs中首先要了解我们需要用TableMapper.class读取hbase中的数据到map\reduce任务中：注意TableMapper的输出key、value是Writeable，输入key、value是固定的！而且我们必须在程序中指定map的输出key、value类型。 job.set

通过mapreduce程序读取hdfs文件写入hbase

allen的博客

02-09

7943

1.在eclipse上面创建maven工程pom文件如下： <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://m

Hadoop入门：HDFS、MapReduce与HBase解析

"对Hadoop中的HDFS、MapReduce、HBase系列知识的介绍，适合初学者了解和学习大数据处理框架的入门资料。" Hadoop是一个开源的分布式计算框架，最初由Doug Cutting创建，目的是为了支持大规模数据处理。它被设计成...