hive
烫红心
这个作者很懒,什么都没留下…
展开
-
hive里的ODS DWD DWB DWS ADS
1.数据仓库DW 1.1简介**** Data warehouse(可简写为DW或者DWH)数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它是一整套包括了etl、调度、建模在内的完整的理论体系。数据仓库的方案建设的目的,是为前端查询和分析作为基础,主要应用于OLAP(on-line Analytical Processing),支持复杂的分析操作,侧重决策支持,听且提供直观易懂的查询结果。比较流行的有:AWS Redshift,Greenplum,Hive等。 1.原创 2020-11-17 17:17:13 · 2954 阅读 · 0 评论 -
Beeline连接hiveserver2报错 User: root is not allowed to impersonate root
Beeline连接hiveserver2报错 报错信息 Error: Could not open client transport with JDBC Uri: jdbc:hive2://node-4:10000: Failed to open new session: java.lang.RuntimeException: org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.security.authorize.AuthorizationEx原创 2020-10-24 13:20:45 · 2319 阅读 · 5 评论 -
hive的分区表
分区表 分区表实际上就是对应一个 HDFS 文件系统上的独立的文件夹,该文件夹下是该分区 所有的数据文件。Hive 中的分区就是分目录,把一个大的数据集根据业务需要分割成小的 数据集。在查询时通过 WHERE 子句中的表达式选择查询所需要的指定的分区,这样的查 询效率会提高很多。 分期表的基本操作 引入分区表(需要根据日期对日志进行管理) /data/hive/warehouse/log_partition/20170702/20170702.log /data/hive/warehouse/log原创 2020-10-24 12:58:26 · 228 阅读 · 0 评论