- 博客(4)
- 收藏
- 关注
原创 Hive 高级操作
查看商品分类表categories,结果按分类名称category_name升序排列,要求同一大类的商品分类在同一个Reducer中处理。查看商品分类表categories,结果按分类名称category_name升序排列。统计order_items表中销售量最多的商品。
2024-05-10 10:01:08
129
原创 1.入门及库表操作(1.2Hive环境配置)
一、安装 1. 下载hive,并解压缩到用户主目录下: tar -xzvf apache-hive-2.3.6-bin.tar.gz 改名: mv apache-hive-2.3.6-bin hive然后执行: source /etc/profilecp hive-env.sh.template hive-env.sh 因为Hive使用了 Hadoop, 需要在 hive-env.sh 文件中指定 Hadoop 安装路径:vim hive-env.sh在打开的配置文件中,添加如下几行:export JA
2024-03-01 10:00:29
674
1
原创 1.入门及库表操作
数据仓库是一种战略性的数据管理系统,它专门设计用来支持商业智能(BI)活动,特别是分析和决策制定。数据仓库的基本概念包括数据源、ETL(Extract, Transform, Load)过程、数据仓库的结构(如面向主题的、集成的、相对稳定的时间变量数据集合)、以及对管理决策过程的全面支持。数据仓库的设计旨在确保数据的一致性和准确性,以便在进行数据分析时可以依赖准确的信息。
2024-03-01 09:59:26
385
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人