Hive
文章平均质量分 88
学习Hadoop生态中的hive
DATA数据猿
路漫漫其修远兮,吾将上下而求索。
探索学习中的一枚数据猿,希望得到你的指点。
展开
-
《工具箱-DBeaver》DBeaver实用功能记录
Dbeaver连接hive,DBeaver线下数据导入...原创 2022-07-05 23:24:36 · 10692 阅读 · 3 评论 -
《Hive系列》Hive详细入门教程
Hive简介Hive:由FaceBook开源用于解决海量结构化日志的数据统计工具Hive:基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL的查询功能。Hive本质将HSQL转化成MapReduce程序Hive处理的数据存储在HDFSHive分析数据底层实现的是MR执行程序运行在Yarn上 窗口函数又叫做开创函数,他是一种分析的函数,专门可以解决报表类型的需求分析。他专门用于计算基于组的某种聚合。对于每个组返回返回是多行,也就是聚合函数的分组只有显示一行。原创 2021-08-03 13:23:18 · 5635 阅读 · 1 评论 -
《Spark系列》建立Hive和Hbase的映射关系,通过Spark将Hive表中数据导入ClickHouse
创建列簇按行导入数据原创 2021-07-31 19:51:16 · 2234 阅读 · 4 评论 -
《Hive系列》Hive问题处理记录
1.Hive failed; error='Cannot allocate memory' (errno=12)2.hive-ls: 无法访问/opt/apps/spark-2.2.0/lib/spark-assembly-*.jar: 没有那个文件或目录3.hive和presto的求数组长度函数区别(hive&cardinality)原创 2021-07-30 13:57:59 · 4153 阅读 · 3 评论 -
《数据同步-Sqoop系列》Sqoop详细入门教程
开源工具用于hadoop(hive)与传统数据库之间数据的导入导出输入:Mysql、Oracle、DB2等关系数据数据导入到Hadoop输出:从Hadoop的数据导出到Mysql、Oracle等等。原创 2021-07-26 12:18:06 · 882 阅读 · 2 评论 -
《Hive系列》Hive管理记录
1.Linux下启动hive服务(beeline)2.Supervisor管理hive服务(metastore,hiveserver2),防止意外杀死Hive服务,导致任务中断3.set hive.fetch.task.conversion=more;设置Fetch 抓取原创 2021-06-16 15:12:25 · 3018 阅读 · 0 评论 -
《Hive系列》Hive实操记录
1.Hive如何显示当前数据库2.根据需求设置是否需要执行MR3.如何正确启动Hive原创 2021-05-22 20:32:16 · 3441 阅读 · 1 评论 -
《Hive系列》Hive快速入门教程
我们默认使用的存储元数据的是hive自带的derby数据库。这个数据库最大的缺点是只支持单session。新建数据库(可视化工具中操作)HDFS/YARN开启。原创 2021-05-11 19:25:19 · 1499 阅读 · 11 评论