hive
spider_d
研究生一枚
展开
-
HIVE中UDTF编写和使用
1. UDTF介绍UDTF(User-Defined Table-Generating Functions) 用来解决 输入一行输出多行(On-to-many maping) 的需求。2. 编写自己需要的UDTF继承org.apache.hadoop.hive.ql.udf.generic.GenericUDTF。实现initialize, process,转载 2017-03-30 11:17:43 · 889 阅读 · 0 评论 -
Hive 中的复合数据结构简介以及一些函数的用法说明
原文地址:https://my.oschina.net/leejun2005/blog/120463目前 hive 支持的复合数据类型有以下几种:map(key1, value1, key2, value2, ...) Creates a map with the given key/value pairsstruct (val1, val2, val3, ...) Crea翻译 2017-03-30 11:21:29 · 857 阅读 · 0 评论 -
Hive 中的 LEFT SEMI JOIN 与 JOIN ON 的前世今生
hive 的 join 类型有好几种,其实都是把 MR 中的几种方式都封装实现了,其中 join on、left semi join 算是里边具有代表性,且使用频率较高的 join 方式。1、联系他们都是 hive join 方式的一种,join on 属于 common join(shuffle join/reduce join),而 left semi join 则属于 map j转载 2017-05-27 13:54:46 · 2351 阅读 · 2 评论