Hive
文章平均质量分 87
恋喵大鲤鱼
一条不止于编码的鱼。
展开
-
Hive 与 SQL 标准和主流 SQL DB 的语法区别
Hive是一种基于Hadoop的数据仓库软件,可以将结构化数据文件映射为一张数据库表,并提供了类SQL查询接口,使得用户可以使用SQL类语言来查询数据。Hive可以处理包括文本、CSV、JSON、ORC和Parquet等格式的数据文件,支持数据的导入、导出、转换等操作。Hive可以在Hadoop集群上运行,利用Hadoop的分布式计算能力,可以处理大规模的数据集。原创 2024-05-11 23:36:40 · 1169 阅读 · 3 评论 -
Hive 表定义主键约束
在 Hive 中,可以使用 PRIMARY KEY 子句来定义主键约束,以确保表中的每行数据都具有唯一标识。如果一个约束指定 RELY,也就是希望 HIVE 基于代价的优化器 CBO(Cost-Based Optimizer)使用约束信息来获得更好的统计信息,得到更好的执行计划。具体到主键约束,一般主键常用于多表关联查询,利用主键约束,可以删除不必要的连接( JOIN ELIMINATION),得到更好的执行计划。对于唯一约束,目前 Hive 是不支持的,但是其他一些约束是支持的。原创 2024-04-29 11:58:44 · 637 阅读 · 3 评论