大数据软件实训
11.11.1
来复制粘贴吧!(头歌实训)
展开
-
Hive -- 桶表
分区提供一个隔离数据和优化查询的便利方式。不过,并非所有的数据集都可形成合理的分区。对于一张表或者分区,Hive 可以进一步组织成桶,也就是更为细粒度的数据范围划分。分桶是将数据集分解成更容易管理的若干部分的另一个技术。分区针对的是数据的存储路径;分桶针对的是数据文件。---创建mydb数据库---使用mydb数据库use mydb;---创建分桶表dept_buck:根据deptno分成4个桶----创建中间表temp_dept_buck:与dept_buck表结构一致。原创 2024-07-16 20:11:22 · 197 阅读 · 0 评论 -
Hive -- 外部分区表
Hive 创建内部表时(默认创建内部表),会将数据移动到数据仓库指向的路径;创建外部表(需要加关键字。在删除表的时候,内部表的元数据和数据会被一起删除,而外部表只删除元数据,不删除数据。本关任务:根据相关知识内容实现 Hive 外部分区表的操作。),仅记录数据所在的路径,不对数据的位置做任何改变。原创 2024-07-16 20:10:27 · 111 阅读 · 0 评论 -
Hive -- 内部分区表
本关任务:根据相关知识内容实现 Hive 内部分区表的操作。原创 2024-07-16 20:08:28 · 141 阅读 · 0 评论 -
Hive基本数据类型
日每种股票总共被客户买入了多少金额。原创 2024-07-15 20:48:45 · 110 阅读 · 0 评论 -
Hive表DDL操作(一)
本关任务:根据编程要求在数据库中对表进行相应的操作。本关任务:根据编程要求在数据库中对表进行相应的操作。本关任务:根据编程要求在数据库中对表进行相应的操作。本关任务:根据编程要求对数据库进行相关操作。转载 2024-07-15 20:47:39 · 160 阅读 · 0 评论