- 博客(7)
- 资源 (6)
- 问答 (1)
- 收藏
- 关注
转载 hive udtf的使用
原文:http://blog.linezing.com/2011/03/hive%E4%B8%ADudtf%E7%BC%96%E5%86%99%E5%92%8C%E4%BD%BF%E7%94%A8 1. UDTF介绍 UDTF(User-Defined Table-Generating Functions) 用来解决 输入一行输出多行(On-to-many mapin
2016-04-24 20:02:52 1062
转载 HIVE中Join的专题---Join详解
Hive表连接的语法支持如下: Sql代码 join_table: table_reference JOIN table_factor [join_condition] | table_reference {LEFT|RIGHT|FULL} [OUTER] JOIN table_reference join_condition | table_refere
2016-04-14 17:27:25 778
转载 hive join详解
Common Join 最为普通的join策略,不受数据量的大小影响,也可以叫做reduce side join ,最没效率的一种join 方式. 它由一个mapreduce job 完成. 首先将大表和小表分别进行map 操作, 在map shuffle 的阶段每一个map output key 变成了table_name_tag_prefix + join_column_value
2016-04-14 17:20:12 405
原创 hbase表拷贝问题
再做hbase 0.94版本向0.98.6版本的表迁移的过程中遇到如下问题: 多次测试发现 是0.98.6版本上的 jackson 版本为 jackson-core-asl-1.8.8.jar jackson-jaxrs-1.8.8.jar jackson-mapper-asl-1.8.8.jar jackson-xc-1.8.8.jar 然而2.0 需要的
2016-04-12 18:33:25 657
转载 hbase 表数据迁移
1 CopyTable 工具 用法: CopyTable is a utility that can copy part or of all of a table, either to the same cluster or another cluster. The target table must first exist. The usage is as follows: $ b
2016-04-12 18:23:21 1614
转载 解决方案:hbase数据迁移发生ERROR: Unknown table错误
以下是文章的原文: 说明:网上众多千篇一律的版本都说要用到一个add_table.rb的文件,可是我的版本根本hbase下就不存在这个文件。 1.把数据表test从hbase下拷出(hadoop dfs -get /hbase/test ./) 2.文件放到新集群的系统上。 3.文件拷入新的hadoop集群hbase下(hadoop dfs -put t
2016-04-01 10:38:22 2143
转载 Hbase集群间数据迁移方法总结(包括不通信集群)
问题导读: 1.不同版本间集群是否可以迁移? 2.distcp命令的作用是什么? 3..MEAT表的作用是什么? 4.相互不通信集群,数据该如何迁移? HBase迁移数据方案一(集群互联) 花了一天的时间查资料做测试,略微的总结了一下hbase数据迁移的方法。 一、需要在hbase集群停掉的情况下迁移 步骤: (1)执行Hadoop distcp
2016-04-01 10:37:40 10284 1
求职大数据,需要什么技术
2014-12-22
TA创建的收藏夹 TA关注的收藏夹
TA关注的人