- 博客(7)
- 资源 (6)
- 问答 (1)
- 收藏
- 关注
转载 hive udtf的使用
原文:http://blog.linezing.com/2011/03/hive%E4%B8%ADudtf%E7%BC%96%E5%86%99%E5%92%8C%E4%BD%BF%E7%94%A81. UDTF介绍UDTF(User-Defined Table-Generating Functions) 用来解决 输入一行输出多行(On-to-many mapin
2016-04-24 20:02:52 1062
转载 HIVE中Join的专题---Join详解
Hive表连接的语法支持如下:Sql代码 join_table: table_reference JOIN table_factor [join_condition] | table_reference {LEFT|RIGHT|FULL} [OUTER] JOIN table_reference join_condition | table_refere
2016-04-14 17:27:25 778
转载 hive join详解
Common Join最为普通的join策略,不受数据量的大小影响,也可以叫做reduce side join ,最没效率的一种join 方式. 它由一个mapreduce job 完成.首先将大表和小表分别进行map 操作, 在map shuffle 的阶段每一个map output key 变成了table_name_tag_prefix + join_column_value
2016-04-14 17:20:12 407
原创 hbase表拷贝问题
再做hbase 0.94版本向0.98.6版本的表迁移的过程中遇到如下问题:多次测试发现 是0.98.6版本上的 jackson 版本为jackson-core-asl-1.8.8.jar jackson-jaxrs-1.8.8.jar jackson-mapper-asl-1.8.8.jar jackson-xc-1.8.8.jar然而2.0 需要的
2016-04-12 18:33:25 659
转载 hbase 表数据迁移
1 CopyTable 工具用法:CopyTable is a utility that can copy part or of all of a table, either to the same cluster or another cluster. The target table must first exist. The usage is as follows:$ b
2016-04-12 18:23:21 1614
转载 解决方案:hbase数据迁移发生ERROR: Unknown table错误
以下是文章的原文:说明:网上众多千篇一律的版本都说要用到一个add_table.rb的文件,可是我的版本根本hbase下就不存在这个文件。1.把数据表test从hbase下拷出(hadoop dfs -get /hbase/test ./)2.文件放到新集群的系统上。3.文件拷入新的hadoop集群hbase下(hadoop dfs -put t
2016-04-01 10:38:22 2163
转载 Hbase集群间数据迁移方法总结(包括不通信集群)
问题导读:1.不同版本间集群是否可以迁移?2.distcp命令的作用是什么?3..MEAT表的作用是什么?4.相互不通信集群,数据该如何迁移?HBase迁移数据方案一(集群互联)花了一天的时间查资料做测试,略微的总结了一下hbase数据迁移的方法。一、需要在hbase集群停掉的情况下迁移步骤:(1)执行Hadoop distcp
2016-04-01 10:37:40 10285 1
求职大数据,需要什么技术
2014-12-22
TA创建的收藏夹 TA关注的收藏夹
TA关注的人