Hive分组排序

最新推荐文章于 2022-08-24 18:06:25 发布

Bee_Darker

最新推荐文章于 2022-08-24 18:06:25 发布

阅读量2.2k

点赞数 1

分类专栏：大数据文章标签：大数据 hive hadoop

本文链接：https://blog.csdn.net/Bee_Darker/article/details/106549848

版权

本文介绍了Hive中的分组排序操作，包括Order by的全局排序、Sort by的局部排序、Group by的分组查询、Distribute by的数据分布以及Cluster by的结合功能。通过实例演示了各种操作的用法和适用场景，对比了它们之间的区别。

摘要由CSDN通过智能技术生成

系统环境

Linux Ubuntu 16.04

jdk-7u75-linux-x64

hive-1.1.0-cdh5.4.5

hadoop-2.6.0-cdh5.4.5

mysql-5.7.24

任务内容

1.全局排序Order by与局部排序Sort by的用法，以及各自适用的场景。

2.分组查询Group by的应用场景与基本语法。

3.Cluster by与Distribute by和Sort by的关系及操作。

任务步骤

1.首先检查Hadoop相关进程，是否已经启动。若未启动，切换到/apps/hadoop/sbin目录下，启动Hadoop。

jps  
cd /apps/hadoop/sbin  
./start-all.sh

2.然后开启Mysql，用于存放Hive的元数据。（密码：zhangyu）

sudo service mysql start

3.切换到/data/hive4目录下，如不存在需提前创建hive4文件夹。

mkdir /data/hive4  
cd /data/hive4

4.使用wget命令，下载http://192.168.1.100:60000/allfiles/hive4中的文件。

wget http://192.168.1.100:60000/allfiles/hive4/goods_visit
wget http://192.168.1.100:60000/allfiles/hive4/order_items
wget http://192.168.1.100:60000/allfiles/hive4/buyer_favorite

最低0.47元/天解锁文章

Bee_Darker

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Hive分组排序

系统环境

相关知识

任务内容

任务步骤