hive
文章平均质量分 89
qq_34795664
这个作者很懒,什么都没留下…
展开
-
Hive搭建&基本操作
1.Hive 安装部署 Hive 安装前需要安装好 JDK 和 Hadoop。配置好环境变量。 根据元数据存储的介质不同,分为下面两个版本,其中 derby 属于内嵌模式。实际生产环境中则使用 mysql 来进行元数据的存储。## 内置 derby 版:解压 hive 安装包bin/hive 启动即可使用缺点:不同路径启动 hive,每一个 hive 拥有一...原创 2018-04-14 17:37:06 · 385 阅读 · 0 评论 -
Hive简介
Apache HiveHive简介1.什么是 HiveHive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件 映射为一张数据库表,并提供类 SQL 查询功能。本质是将 L SQL 转换为 e MapReduce 程序。主要用途:用来做离线数据分析,比直接用 MapReduce 开发效率更高2.Hive 架构2.1Hive 架构图...原创 2018-04-16 00:21:10 · 211 阅读 · 0 评论 -
hive优化
hive之于数据民工,就如同锄头之于农民伯伯。hive用的好,才能从地里(数据库)里挖出更多的数据来。用过hive的朋友,我想或多或少都有类似的经历:一天下来,没跑几次hive,就到下班时间了。hive在极大数据或者数据不平衡等情况下,表现往往一般,因此也出现了presto、spark-sql等替代品。今天不谈其它,就来说说关于hive,个人的一点心得。一. 表连接优化 1...原创 2018-04-16 14:43:27 · 223 阅读 · 0 评论