Hbase整合MapReduce两个注意的地方

最新推荐文章于 2024-01-21 03:36:23 发布

小萌猿

最新推荐文章于 2024-01-21 03:36:23 发布

阅读量1.9k

点赞数

分类专栏： HBase 文章标签： HBase MapReduce 乱码

本文链接：https://blog.csdn.net/qq_31246691/article/details/82716116

版权

HBase 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

一、通过javaAPI插入数据到HBase时，HBase里scan出来的数据乱码，如下代码：

Put put = new Put(Bytes.toBytes(key.get()));

我这里的key是Map阶段的输入key，格式为LongWritable，插入数据后，Hbase对应表的rowkey出现了乱码。
解决方法：

Put put = new Put(Bytes.toBytes(key.toString()));

类似的，对于int,double同样需要先转为String，否则会乱码

二、***********.jar is not a valid DFS filename
出错代码如下：

TableMapReduceUtil.initTableMapperJob("example", scan, 
                MyMapper.class, Text.class, Text.class, job);
TableMapReduceUtil.initTableReducerJob("row", MyReduce.class, job);

原因：没有区分本地文件系统与Hadoop集群文件系统
修改：

TableMapReduceUtil.initTableMapperJob("example", scan, 
                MyMapper.class, Text.class, Text.class, job，false);
TableMapReduceUtil.initTableReducerJob("row", MyReduce.class, job,null,null,null,null,false);