hive
文章平均质量分 50
TracyGao01
保持专注
展开
-
Hive 元数据信息调整使用UTF-8编码
调整元数据编码转载 2022-08-12 14:47:37 · 966 阅读 · 0 评论 -
Apache Beeline for Iceberg配置
组件版本:Iceberg:0.11.0Hive Beeline:2.1.0文章目录简介修改配置文件配置Beeline环境变量测试验证简介配置Iceberg on Hive修改配置文件修改hive-site.xml,添加如下配置:<property><name>iceberg.mr.catalog</name><value>hive</value></property><property><.原创 2021-08-23 19:22:16 · 393 阅读 · 0 评论 -
基于Apache Sentry的Hive权限管理
前言:本文是基于Apache Sentry做Hive权限管理的相关配置及测试hue权限管理请参考:https://blog.csdn.net/u012551524/article/details/79392439hive自身的权限管理请参考:https://blog.csdn.net/u012551524/article/details/79655370CDH环境安装参考:https:...原创 2018-12-04 16:58:10 · 4911 阅读 · 1 评论 -
hive 数仓开发任务优化
Hive性能优化项目:基于hive的dmp数据仓库搭建Hive:apache开源组件,基于hdfs文件系统及mapreduce计算引擎的关系型数据库,弱索引(目前还没怎么有用过),基本不支持实施数据处理,适用于大数据量的存储及离线的大数据量的数据挖掘优化:1:调度优化,模型优化资源开放的情况下,模型日常T+1调度模型图如下(数据流图):数据模型每层的调度要足够灵活,尽量避免由于...原创 2018-07-31 21:19:55 · 1048 阅读 · 0 评论 -
hive 执行报错:1.2 GB of 1 GB physical memory used; 2.2 GB of 2.1 GB virtual memory used. Killing contain
1、如果是physical memory超了 修改yarn container最小内存大小,适当调大 yarn.scheduler.minimum-allocation-mb 4G2、如果是virtual memory超了修改所有nodemanager的yarn-site.xml配置文件,添加如下: yarn.nodemanager.vmem-check-enabled ...原创 2018-06-02 01:12:04 · 3701 阅读 · 0 评论 -
hive报错:Couldn't find log associated with operation handle: OperationHandle
hive client抛出异常:org.apache.hive.service.cli.HiveSQLException: Couldn't find log associated with operation handle: OperationHandle [opType=EXECUTE_STATEMENT, getHandleIdentifier()=553fc654-d0ac-4869-...原创 2018-05-28 14:45:40 · 3252 阅读 · 0 评论 -
Hue管理用户对于hive数据表的操作权限
Hue管理用户对于hive数据表的操作权限 1、 hue开通用户,只给该用户hive的访问权限http://blog.csdn.net/u012551524/article/details/79392439首先创建一个名pbdd的hue用户,给该用户hive的访问权限2、 hive权限控制1) 修改hive的配置项,在hive-sit...原创 2018-03-22 16:11:41 · 14880 阅读 · 4 评论 -
beeline取出hive表数据到CSV文件,做数据取样
beeline取出hive表数据到CSV文件,做数据取样:beeline -u jdbc:hive2:// --verbose=true --outputformat=csv2 -e "select * from test.INFO_FLUME_DATA_DT0 limit 10">>tt.csv原创 2018-01-13 23:55:40 · 6631 阅读 · 2 评论 -
hive select报错 Unable to determine if hdfs
系统版本:Ubuntu 14.04集群:CDH 5.11.0其它相关组件没有做升级,为CDH 5.11.0插件固定版本问题描述:由于该集群为一个小的测试集群,采用最小化部署,只有3个节点,在首次部署安装后,HDFS部署了HA,但是后期测试压力较大,集群资源不足,考虑到测试集群,就去掉了HA,HDFS NameNode为单点,切换后,Hive报错:hive报错信息:FAILE...原创 2017-09-20 18:52:49 · 3318 阅读 · 6 评论 -
Flume-将数据写入动态分区表
一、 场景描述实时监控文件目录,将目录中的实时产生的数据文件(文件内容非动态)写入动态分区,分区为3级(设备ID/文件产生日期/文件产生的时间(h)).文件名格式如下(日期+时间+产品ID.txt)二、 主要存在的难点由于flume只支持传入一些简单的参数变量(时间/日期/文件名等),所以这里我们如果想动态的识别我们的文件名并直接生成sink的路径及相应文件名有困难。三、 解决方法...原创 2017-04-12 22:26:20 · 5012 阅读 · 0 评论
分享