hive
文章平均质量分 79
潇水汀寒
这个作者很懒,什么都没留下…
展开
-
hive:MoveTask
运行SQL时出了个错:SQL: INSERT OVERWRITE DIRECTORY 'result/testConsole' select count(1) from nutable; 错误信息:Failed with exception Unable to rename: hdfs://indigo:8020/tmp/hive-root/hive_2013-08-22_17-35-05原创 2013-08-22 21:08:51 · 10518 阅读 · 1 评论 -
hive 备忘1
调试前先确定 hive shell 能正常工作,今天因为这个多花了很长时间有两个 RunJar进程并不表示HiveServer 运行正常,可查看服务状态来确定/etc/init.d/hive-server2 status自己加的HOOK中访问的Web工程地址是局域网地址,总是访问不到,才发现启动JBOSS要加参数 -b 0.0.0.0原创 2013-08-13 18:14:40 · 3275 阅读 · 0 评论 -
编译 hive
这里下载代码:https://github.com/cloudera/hive/tree/cdh4-0.10.0_4.3.0修改build.properties在http://www.apache.org/dyn/closer.cgi/hadoop/core/ 中为 hadoop.mirror 找个地址 eclipse 安装 ivy 插件编译 :原创 2013-08-12 21:44:05 · 2581 阅读 · 0 评论 -
Driver.run 备忘
StartHookPreHookPostHookFinishHookFailureHook1、Driver.run 逻辑:执行hook, 编译SQL,执行SQL,执行hook。此处读的hook 的配置:hive.exec.driver.run.hookspublic CommandProcessorResponse run(String command, bo原创 2013-08-13 00:23:38 · 1264 阅读 · 0 评论 -
hive 调用栈
at org.apache.hadoop.hive.ql.Driver.execute(Driver.java:1108) at org.apache.hadoop.hive.ql.Driver.run(Driver.java:973) at org.apache.hadoop.hive.ql.Driver.run(Driver.java:893) at org.apache.hadoop.原创 2013-08-13 00:49:11 · 958 阅读 · 0 评论 -
hive 中的异常:1、ClassNotFound
原来用 hive shell 时从没考虑过在哪个目录下使用,有时候在不同目录下还是有区别的,如下面异常,只要换个目录再运行就没这个问题了:[apache@indigo hive]$ pwd/home/apache/diary/0829/hdp_manual_install_rpm_helper_files-2.0.0.22/configuration_files/hive[apache@i原创 2013-08-29 23:33:07 · 5249 阅读 · 1 评论 -
Hive SQL 语义分析:select count(*) from tableName
从客户端提交一个 Hive SQL 到 Driver 提交 MapReduce Job,有一个对SQL进行词法分析和语义分析的过程,下面以 select count(*) from tableName 来描述其过程。一、词法分析使用ANTLR分析SQL,生成语法树,每个节点是一个 ASTNode,它有自己的类型。来看看 select count(*) from tableName 的原创 2013-09-06 02:01:53 · 5602 阅读 · 1 评论 -
hive 存储格式和压缩方式 一:Snappy + SequenceFile
1、设置三个参数:hive.exec.compress.output 声明对 hive 查询的输出结果进行压缩,并指定压缩方式为 Snappy。对SequenceFile 有 mapred.output.compression.type,在CDH4中默认就是 BLOCK。SET hive.exec.compress.output=true;SET mapred.output.com原创 2013-08-30 02:15:38 · 14015 阅读 · 0 评论 -
Snappy,Lzo,bzip2,gzip,deflate文件解压
Snappy,Lzo,bzip2,gzip,deflate 都是hive常用的文件压缩格式,各有所长,这里咱们只关注具体文件的解压一、先贴代码:package compress;import org.apache.commons.logging.Log;import org.apache.commons.logging.LogFactory;import org.apache.原创 2013-12-02 14:26:13 · 10511 阅读 · 0 评论