Hive_SK_Lavender的博客-CSDN博客

Hive

关注

关注数：文章数：6 文章阅读量：28765 文章收藏量：18

作者: SK_Lavender

一只站在树上的鸟儿，从来不会害怕树枝会断裂，因为它相信的不是树枝，而是自己的翅膀。与其每天担心未来，不如努力做好现在。因为，成功的路上，只有奋斗才能给你最大的安全感。

展开

(1) Hive JOIN语句详解

本文讲述hive语句的JOIN语句的一般用法。Hive支持通常的SQL JOIN语句，但是只支持等值连接。

原创 2016-02-27 14:31:14 · 746 阅读 · 0 评论
(2) Hive 数据导入方式

Hive 数据导入方式概述：在Hive中，没有行级别的数据插入、数据更新和删除操作。往表中装载数据的唯一途径就是使用大量的数据装载操作。其中hive的数据导入方式分为四种，分别是从本地的文件系统中导入数据从Hadoop分布式文件系统(HDFS)中导入数据通过查询语句向表中插入数据单个查询语句中创建表并加载数据 1 从本地的文件系统中导入数据1.1 本地系统文件

原创 2016-04-02 18:10:40 · 2033 阅读 · 0 评论
采用java和python编写hive中的udf

在hive中，用户自定义函数（UDF）是一个允许用户扩展HiveQL的强大的功能。用户将自定义的函数加入到用户会话中（交互式的或者通过脚本执行的），它们就会像内置的函数一样使用。编写UDF的java实现用户编写一个UDF，首先要继承UDF类并且实现evaluate()函数。在查询中对应的每个应用到这个函数的地方都会对这个类进行实例化。对于每一行输入都会调用到evaluate()函数。而evalua

原创 2016-10-26 16:04:49 · 2564 阅读 · 0 评论
那些年，写hive sql时所踩过的坑

本文记述一些本人在用hive时，所遇到的一些大坑小坑，一是防止自己再次落坑，二是避免旁人也掉入进去。文章会不定时更新。

原创 2016-09-30 17:21:23 · 6344 阅读 · 0 评论
transpose and pivot data in hive

1. 键-值对的形式存储数据有时候，我们在hive中编写hql的时候，可以用键-值对的形式存储结果。比如有一些同学在一些课程中的学习行为，我们可以记录成如下形式： student class_name key value A english answer_num 9 A chinese answer_num 15 B english an

原创 2016-11-14 20:37:55 · 2513 阅读 · 0 评论
hive中按照一个字段的区间进行统计

1. question给定一个hive表tmp，表中有一个字段result(double型)；给定一个区间分类个数m，统计每个区间内的count(*)的数量。2. answer在linux终端下，# step1 设定区间分类个数，此处设置为10m=10# step2 求解字段 result 的最大值和最小值section=`hive -e "select max(result) as max_

原创 2016-11-15 19:47:24 · 14565 阅读 · 1 评论

Hive

作者: SK_Lavender

(1) Hive JOIN语句详解

(2) Hive 数据导入方式

采用java和python编写hive中的udf

那些年，写hive sql时所踩过的坑

transpose and pivot data in hive

hive中按照一个字段的区间进行统计