Hive
打怪的蚂蚁
这个作者很懒,什么都没留下…
展开
-
Hive语句优化
参考地址:http://www.cnblogs.com/end/archive/2013/01/15/2861448.html hive玩得好不好,在于你对mapreduce理解深不深叻;当然借鉴学习也很重要 倾斜分成group by造成的倾斜和join造成的倾斜  假设网站访问日志中会记录用户的user_id,并且对于注册用户使用其用户表的user_id,对于非注册用户使用一个user转载 2017-02-13 21:07:08 · 854 阅读 · 0 评论 -
Hive UDF整理
字符串函数 字符串长度函数:length 语法: length(string A) 返回值: int 说明:返回字符串A的长度 举例: hive> select length(‘abcedfg’) from dual; 7 字符串反转函数:reverse 语法: reverse(string A) 返回值: string转载 2017-02-13 21:09:09 · 677 阅读 · 0 评论 -
hive: str_to_map使用案例
使用说明: https://cwiki.apache.org/confluence/display/Hive/LanguageManual+UDF map str_to_map(text[, delimiter1, delimiter2]) Splits text into key-value pairs using two delimiters. Deli原创 2017-02-13 21:10:33 · 10206 阅读 · 0 评论 -
基于Hadoop的数据仓库Hive 基础知识
Hive是基于Hadoop的数据仓库工具,可对存储在HDFS上的文件中的数据集进行数据整理、特殊查询和分析处理,提供了类似于SQL语言的查询语言–HiveQL,可通过HQL语句实现简单的MR统计,Hive将HQL语句转换成MR任务进行执行。 一、概述 1-1 数据仓库概念 数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Int转载 2017-03-02 12:15:15 · 757 阅读 · 0 评论