自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Hive 高级操作

查看商品分类表categories,结果按分类名称category_name升序排列,要求同一大类的商品分类在同一个Reducer中处理。查看商品分类表categories,结果按分类名称category_name升序排列。统计order_items表中销售量最多的商品。

2024-05-10 10:01:08 129

原创 Hive 高级操作

统计order_items表中销售量排名前十的商品。统计每个商品大类下的商品分类。(2)GUBE与ROLLUP。

2024-05-10 09:46:39 359

原创 1.入门及库表操作(1.2Hive环境配置)

一、安装 1. 下载hive,并解压缩到用户主目录下: tar -xzvf apache-hive-2.3.6-bin.tar.gz 改名: mv apache-hive-2.3.6-bin hive然后执行: source /etc/profilecp hive-env.sh.template hive-env.sh 因为Hive使用了 Hadoop, 需要在 hive-env.sh 文件中指定 Hadoop 安装路径:vim hive-env.sh在打开的配置文件中,添加如下几行:export JA

2024-03-01 10:00:29 674 1

原创 1.入门及库表操作

数据仓库是一种战略性的数据管理系统,它专门设计用来支持商业智能(BI)活动,特别是分析和决策制定。数据仓库的基本概念包括数据源、ETL(Extract, Transform, Load)过程、数据仓库的结构(如面向主题的、集成的、相对稳定的时间变量数据集合)、以及对管理决策过程的全面支持。数据仓库的设计旨在确保数据的一致性和准确性,以便在进行数据分析时可以依赖准确的信息。

2024-03-01 09:59:26 385 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除