hive
spider_d
研究生一枚
展开
-
HIVE中UDTF编写和使用
1. UDTF介绍 UDTF(User-Defined Table-Generating Functions) 用来解决 输入一行输出多行(On-to-many maping) 的需求。 2. 编写自己需要的UDTF 继承org.apache.hadoop.hive.ql.udf.generic.GenericUDTF。实现initialize, process,转载 2017-03-30 11:17:43 · 863 阅读 · 0 评论 -
Hive 中的复合数据结构简介以及一些函数的用法说明
原文地址:https://my.oschina.net/leejun2005/blog/120463 目前 hive 支持的复合数据类型有以下几种: map (key1, value1, key2, value2, ...) Creates a map with the given key/value pairs struct (val1, val2, val3, ...) Crea翻译 2017-03-30 11:21:29 · 806 阅读 · 0 评论 -
Hive 中的 LEFT SEMI JOIN 与 JOIN ON 的前世今生
hive 的 join 类型有好几种,其实都是把 MR 中的几种方式都封装实现了,其中 join on、left semi join 算是里边具有代表性,且使用频率较高的 join 方式。 1、联系 他们都是 hive join 方式的一种,join on 属于 common join(shuffle join/reduce join),而 left semi join 则属于 map j转载 2017-05-27 13:54:46 · 2292 阅读 · 2 评论