- 博客(3)
- 收藏
- 关注
原创 Hive 内外部表的定义、区别以及数据管理方式
数据(data)都存储在HDFS上,内部表由Hive自身管理,外部表数据由HDFS管理;内部表(managed table): 未被external修饰的表,也叫管理表。外部表:删除表会删除表的元数据(metadata),但不会删除表数据(data)。内部表:删除表会删除表的元数据(metadata)和表数据(data)。外部表(external table):被external修饰的表。元数据(metadata)都存储在mysql上,由mysql管理。
2024-05-23 10:08:19 218 1
原创 hive创建数据库与表
Hive是基于Hadoop的数据仓库工具,它提供了一种类SQL语言,称为HiveQL,使得开发人员可以像使用SQL一样方便地查询和分析存储在Hadoop集群中的数据。创建数据库和表是使用Hive进行数据存储和分析的基础步骤之一。上面的命令将创建一个包含三个字段(id、name和age)的表,并指定了表的行格式以及文件存储格式。字段之间使用逗号作为分隔符,每行记录使用换行符进行分隔。
2024-05-23 10:02:36 384 1
原创 win10环境安装docker及使用docker搭建hadoop、hive环境
容器端口的映射 如果冲入 自己该。如图所示,则表示安装成功!,点击左上角连接图标,选择。)填写相关参数,测试连接。安装成功后关机重启!
2024-03-01 09:29:38 419 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人