hive
文章平均质量分 75
JamesFen
这个作者很懒,什么都没留下…
展开
-
Hive与表操作有关的语句
Hive与表操作有关的语句1.创建表的语句:Create [EXTERNAL] TABLE [IF NOT EXISTS] table_name[(col_name data_type [COMMENT col_comment], ...)][COMMENT table_comment][PARTITIONED BY (col_name data_type [COMMENT col_原创 2014-03-24 13:09:15 · 753 阅读 · 0 评论 -
后台执行UNIX/Linux命令和脚本的五种方法
hiveserver 后台启动nohup "${HIVE_HOME}"/bin/hive --service hiveserver2 &1. 使用&符号在后台执行命令你可以在Linux命令或者脚本后面增加&符号,从而使命令或脚本在后台执行,例如:.$ ./my-shell-script.sh2. 使用nohup在后台执行命令使用&符号在后台执行命令或脚本后,如果你退出登转载 2015-03-13 18:03:41 · 907 阅读 · 0 评论 -
HiveServer2的配置使用
HiveServer2的配置和使用hive-site.xml配置hiveserver2的配置property> name>hive.support.concurrencyname> description>Enable Hive's TableLock Manager Servicedescription> value>truevalue>proper转载 2015-03-13 17:52:25 · 3383 阅读 · 0 评论 -
eclipse 远程操作HIVE
eclipse 远程操作HIVE原创 2014-06-12 23:56:06 · 2638 阅读 · 0 评论 -
hive 数据类型
列类型Hive支持的数据类型如下:原生类型:TINYINTSMALLINTINTBIGINTBOOLEANFLOATDOUBLESTRINGBINARY (Hive 0.8.0以上才可用)TIMESTAMP (Hive 0.8.0以上才可用)复合类型:arrays: ARRAYmaps: MAPstructs: STRUCTunion: UNIONTYPE转载 2014-12-26 00:09:09 · 997 阅读 · 0 评论 -
Hive与Hbase结合使用
Hive与Hbase结合使用hive的启动需要使用到zookeeper, 所以, 要么自己搭建zookeeper, 要么跟其它东西一起使用, 我这里做的是跟hbase一起使用的zookeeper, 因为hbase自带zookeeper, hbase启动就会启动zookeeper, 而hive默认会连接本机的2181端口, 所以我这里选择在slaver3上使用hive. 集群的搭建以及机器的分配转载 2014-12-25 23:01:50 · 2532 阅读 · 0 评论 -
hive存储处理器(StorageHandlers)以及hive与hbase整合
此篇文章基于hive官方英文文档翻译,有些不好理解的地方加入了我个人的理解,官方的英文地址为:1.https://cwiki.apache.org/confluence/display/Hive/StorageHandlers2.https://cwiki.apache.org/confluence/display/Hive/HBaseIntegration 一 存翻译 2014-12-26 02:21:49 · 5591 阅读 · 0 评论 -
hive与hbase数据类型对应关系
hive与hbase数据类型对应关系当hbase中double,int 类型以byte方式存储时,用字符串取出来必然是乱码。在hivd与hbase整合时也遇到这个问题:做法是:#b1.加#bCREATE EXTERNAL TABLE hivebig (key string,CUST_NAME string,PHONE_NUM int,BRD_WORK_FLUX double)原创 2014-12-26 02:20:28 · 10497 阅读 · 1 评论 -
Hive之数据查询
Hive之数据查询发布于: 2013 年 10 月 11 日 由 Aaron 发布于: Hive一,排序和聚合对于排序有两种方式,一种是order by 一种是sort byorder by 会对所有的数据进行排序,所以最后会只有一个reducer来处理,如果数据量非常大,效率会非常差劲sort by是部分排序,只是对一个reducer的数据进行排序转载 2014-09-27 18:37:25 · 2109 阅读 · 0 评论 -
Hive 进阶
Hive 桶 分区 map array struct原创 2014-06-18 14:18:38 · 1834 阅读 · 0 评论 -
Hive 查询优化总结
一、join优化Join查找操作的基本原则:应该将条目少的表/子查询放在 Join 操作符的左边。原因是在 Join 操作的 Reduce 阶段,位于 Join 操作符左边的表的内容会被加载进内存,将条目少的表放在左边,可以有效减少发生内存溢出错误的几率。Join查找操作中如果存在多个join,且所有参与join的表中其参与join的key都相同,则会将所有的join合并到一个ma转载 2014-06-19 15:32:12 · 1076 阅读 · 0 评论 -
Hive Joins 用法与操作
Hive表连接的语法支持如下:Sql代码 join_table: table_reference JOIN table_factor [join_condition] | table_reference {LEFT|RIGHT|FULL} [OUTER] JOIN table_reference join_condition | ta转载 2014-06-19 15:29:06 · 835 阅读 · 0 评论 -
Hive中SELECT TOP N的方法(order by与sort by的区别)
我想说的SELECT TOP N是取最大前N条或者最小前N条。Hive提供了limit关键字,再配合order by可以很容易地实现SELECT TOP N。但是在Hive中order by只能使用1个reduce,如果表的数据量很大,那么order by就会力不从心。例如我们执行SQL:select a from ljntest01 order by a limit 10;控制台转载 2014-06-19 14:27:10 · 2223 阅读 · 0 评论 -
ubuntu下hive-0.8.1配置
1、下载hive包wget http://labs.mop.com/apache-mirror/hive/stable/hive-0.8.1.tar.gz,并用tar -xzvf 将其解压到要安装的目录,我是放在/home/ckl/hadoop-0.20.2/hive2、vim ~/.bashrcexport HIVE_HOME=$HADOOP_HOME/hivee转载 2014-05-13 15:27:17 · 937 阅读 · 0 评论 -
hive-0.11.0安装
一、安装 1、 下载安装hivehive-0.11.0.tar.gz(稳定版)目录:/data tar –zxvfhive-0.11.0.tar.gz 2、 配置 把所有的模板文件copy一份 cd /opt/hive-0.11.0/conf转载 2014-03-29 11:48:14 · 1118 阅读 · 0 评论 -
Hive安装 …
Hive安装 mysql使用主机(win7)上的mysql数据库,启动后,要关闭360和win7自带的防火墙,确保在虚拟机里能拼通主机************************************************** D:\server\mysql-5.0.16-win32\bin grant all on*.* to hive@'l原创 2014-03-24 13:09:08 · 830 阅读 · 0 评论 -
当在hive中show table …
当在hive中show table 时如果报以下错时FAILED: Error in metadata: javax.jdo.JDODataStoreException:Error(s) were found while auto-creating/validating the datastorefor classes. The errors are printed in the log,原创 2014-03-24 13:09:10 · 2053 阅读 · 0 评论 -
hive-2.0安装
版本与前提条件: hadoop-2.6.0,hive-2.0.0一、hive安装1、官网下载地址:http://hive.apache.org/downloads.html下载后解压到指定目录,例如 /usr/local/hivetar -xvf apache-hive-2.0.0-bin.tar.gz ; mv apache-hive-2.0.0-bin /usr/local/hive2、原创 2016-09-03 17:40:37 · 1175 阅读 · 0 评论