Hive
文章平均质量分 80
Hive 是基于 Hadoop 的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。
G皮T
计算机科学与技术本科,计算机技术硕士,现任职于某互联网公司,担任测试开发工程师。CSDN云原生领域优质创作者、博客专家。书籍《大数据测试开发工程师的第一本书》正在积极撰写中,敬请期待。微信公众号:大数据与AI实验室。《Java 百“练”成钢》连载中,欢迎关注!
展开
-
【大数据】HiveQL的数据操作
HiveQL的相关数据操作。原创 2022-05-31 23:41:19 · 544 阅读 · 2 评论 -
【大数据】HiveQL:索引
Hive 中的索引和那些关系型数据库中的一样,需要进行仔细评估才能使用。维护索引也需要额外的存储空间,同时创建索引也需要消耗计算资源。用户需要在建立索引为查询带来的好处和因此而需要付出的代价之间做出权衡。......原创 2022-06-06 10:51:11 · 408 阅读 · 1 评论 -
【大数据】Hive性能调优
学习 Hive 是如何工作的第一个步骤就是学习 EXPLAIN 功能,其可以帮助我们学习 Hive 是如何将查询转化成 MapReduce 任务的。原创 2022-06-17 17:24:52 · 707 阅读 · 1 评论 -
【大数据】Hive基础知识
Hive基础知识1.Hive 有哪些特点?Hive 最适合于数据仓库应用程序,使用该应用程序进行相关的静态数据分析,不需要快速响应给出结果,而且数据本身不会频繁变化。Hive 不是一个完整的数据库。Hadoop 以及 HDFS 的设计本身约束和局限性的限制了 Hive 所能胜任的工作。其中最大的限制就是不支持记录级别的更新、插入或者删除操作。但是用户可以通过查询生成新表或者将查询结果导入到文件中。Hive 查询延时比较严重。传统数据库中在秒级别可以完成的查询在中,即使数据集相对较小,往往也需要原创 2022-05-21 22:03:39 · 1456 阅读 · 1 评论 -
【大数据】Hive 表中插入多条数据
在 Hive 中,我们可以使用 INSERT INTO 语句向表中插入数据。当我们需要插入多条数据时,有多种方式可以实现。本文将介绍如何在 Hive 表中插入多条数据,并提供相应的代码示例。原创 2023-08-20 17:25:17 · 9966 阅读 · 1 评论 -
【大数据】HiveQL关于数据库和表的操作命令
HiveQL 是 Hive 查询语言。Hive 和 MySQL 最接近,但二者仍存在显著差别。Hive 不支持行级插入操作、更新操作和删除操作。Hive 也不支持事务。原创 2022-05-31 16:24:02 · 1437 阅读 · 2 评论 -
【大数据】HiveQL:视图
视图可以允许保存一个查询,并向对待表一样对这个查询进行操作。这是一个逻辑结构,因为它不像一个表会存储数据。换句话说,Hive 目前暂不支持物化视图。当一个查询引用一个视图时,这个视图所定义的查询语句将和用户的查询语句组合在一起,然后供 Hive 制定查询计划。从逻辑上讲,可以想象为 Hive 先执行这个视图,然后使用这个结果进行余下后续的查询。...原创 2022-06-06 10:43:51 · 532 阅读 · 2 评论 -
【大数据】Hive中的模式设计
Hive 看上去以及实际行为都像一个关系型数据库,并且 Hive 提供的查询语言也确实和之前使用过的 SQL 语言非常地相似。不过,Hive 实现和使用的方式和传统的关系型数据库是非常不同的。通常用户视图移植关系型数据库中的模式,而事实上 Hive 是反模式的。...原创 2022-06-16 10:58:24 · 533 阅读 · 2 评论 -
【大数据】Hive 中的批量数据导入
在前面的博客中,我简单介绍了几种向 Hive 表中插入数据的方法。然而更多的时候,我们并不是一条数据一条数据的插入,而是以批量导入的方式。在本文中,我将全面介绍几种向 Hive 中批量导入数据的方法。原创 2023-08-23 23:58:01 · 2401 阅读 · 1 评论 -
【大数据】HiveQL的查询操作
HiveQL的查询操作。原创 2022-06-02 22:47:04 · 932 阅读 · 2 评论