hive
文章平均质量分 78
hyalone2010
这个作者很懒,什么都没留下…
展开
-
hive中用python脚本做小表的关联
forhive.py目前只支持两个函数memjoin读入数据文件到内存,与hive中的数据表进行join,需要7个参数,如果关联多个文件则7+6x个参数# 第一个参数 tabledefinefile 文件中需给出数据表的定义,数据表名称 : 字段名称1,>字段名称2,...,字段名称n,参考tabledef.txt,数据表名称可以是后面文件名,如果不完全一样文件路径需要包含数据原创 2014-07-03 09:12:18 · 921 阅读 · 0 评论 -
用java写hive的rownumber函数
hive支持java写udf、udaf、udtf,用udf实现原创 2014-07-03 09:35:10 · 883 阅读 · 0 评论 -
hive中用java实现的udaf做线性回归
add jar some.jar;create temporary function lr as'com.autohome.hive.LineRegressUdaf';原创 2014-07-03 09:43:54 · 1960 阅读 · 0 评论 -
hive数据表结构导出到文件
通过hive的desc命令把数据表字段写到文件中,方便外部数据处理。原创 2014-07-09 10:52:39 · 5232 阅读 · 1 评论