Hive
风隐才藏
这个作者很懒,什么都没留下…
展开
-
Hive 随谈(六)– Hive 的扩展特性
原文链接:http://www.alidata.org/archives/604Hive 是一个很开放的系统,很多内容都支持用户定制,包括:文件格式:Text File,Sequence File内存中的数据格式: Java Integer/String, Hadoop IntWritable/Text用户提供的 map/reduce 脚本:不管什么语言,利转载 2013-01-06 14:36:50 · 837 阅读 · 0 评论 -
Hive 随谈(二)– Hive 结构
原文链接:http://www.alidata.org/archives/499Hive 体系结构Hive 的结构如图所示,主要分为以下几个部分:用户接口,包括 CLI,Client,WUI。元数据存储,通常是存储在关系数据库如 mysql, derby 中。解释器、编译器、优化器、执行器。Hadoop:用 HDFS 进行存储,利用转载 2013-01-06 09:54:55 · 671 阅读 · 0 评论 -
Hive原理与不足
UHP博客文章地址:http://yuntai.1kapp.com/?p=1035原创文章,转载请注明出处:http://blog.csdn.net/wind5shy/article/details/8560059架构UI:用户提交查询请求与获得查询结果。包括三个接口:命令行(CLI)、Web GUI(Hue)和客户端。Driver:接受查询请求与返回查原创 2013-01-31 15:48:44 · 6674 阅读 · 0 评论 -
Hive 随谈(五)– Hive 优化
原文链接:http://www.alidata.org/archives/595Hive 针对不同的查询进行了优化,优化可以通过配置进行控制,本文将介绍部分优化的策略以及优化控制选项。列裁剪(Column Pruning)在读数据的时候,只读取查询中需要用到的列,而忽略其他列。例如,对于查询: SELECT a,b FROM T WHERE e 其中,T 包转载 2013-01-06 14:31:06 · 863 阅读 · 0 评论 -
Hive 随谈(四)– Hive QL
原文链接:http://www.alidata.org/archives/581Hive 的官方文档中对查询语言有了很详细的描述,请参考:http://wiki.apache.org/hadoop/Hive/LanguageManual ,本文的内容大部分翻译自该页面,期间加入了一些在使用过程中需要注意到的事项。Create TableCREATE [EXTERNAL] T转载 2013-01-06 14:10:24 · 809 阅读 · 0 评论 -
Hive 随谈(三)– Hive 和数据库的异同
原文链接:http://www.alidata.org/archives/551摘要:由于 Hive 采用了 SQL 的查询语言 HQL,因此很容易将 Hive 理解为数据库。其实从结构上来看,Hive 和数据库除了拥有类似的查询语言,再无类似之处。本文将从多个方面来阐述 Hive 和数据库的差异。数据库可以用在 Online 的应用中,但是Hive 是为数据仓库而转载 2013-01-06 11:32:39 · 624 阅读 · 0 评论 -
Hive 随谈(一)– Hive 入门
原文链接:http://www.alidata.org/archives/481Hive 是什么在接触一个新的事物首先要回到的问题是:这是什么?这里引用 Hive wiki 上的介绍:Hive is a data warehouse infrastructure built on top of Hadoop. It provides tools to enabl转载 2013-01-06 11:23:47 · 596 阅读 · 0 评论