hive
万琛
没有远虑,必有近忧。
展开
-
Hive-拉链表
一、问答介绍1.什么是拉链表? 维护历史状态,以及最新状态数据的一种表,拉链表根据拉链粒度的不同,实际上相当于快照,只不过做了优化,去除了一部分不变的记录,通过拉链表可以很方便的还原出拉链时点的客户记录。记录一个事物从开始,一直到当前状态的所有变化的信息(生命周期)。核心字段为生效开始日期与生效结束日期(粒度)。2.为什么用拉链表(应用场景决定)?1)原数据量很大(查询费劲...原创 2020-01-14 09:36:30 · 345 阅读 · 0 评论 -
关于hadoop3.x MR报错:找不到或无法加载主类 org.apache.hadoop.mapreduce.v2.app.MRAppMaster
用的apache Hadoop3.X,今天运行MR报错:找不到或无法加载主类 org.apache.hadoop.mapreduce.v2.app.MRAppMaster关键需要配置两个配置:mapred-site.xml 和 yarn-site.xml下面配置hadoop classpath。先运行shell命令:hadoop classpath复制输出到上面两个文件中...原创 2019-07-26 15:22:47 · 621 阅读 · 0 评论