- 博客(6)
- 资源 (3)
- 收藏
- 关注
转载 Hive 随谈(六)– Hive 的扩展特性
Hive 随谈(六)– Hive 的扩展特性 原文地址:http://www.alidata.org/archives/604 Hive 是一个很开放的系统,很多内容都支持用户定制,包括: 文件格式:Text File,Sequence File 内存中的数据格式: Java Integer/String, Hadoop IntWritable/Text 用户提供的 ma
2013-04-03 10:32:28 702
转载 Hive 随谈(五)– Hive 优化
Hive 随谈(五)– Hive 优化 原文地址:http://www.alidata.org/archives/595 Hive 针对不同的查询进行了优化,优化可以通过配置进行控制,本文将介绍部分优化的策略以及优化控制选项。 列裁剪(Column Pruning) 在读数据的时候,只读取查询中需要用到的列,而忽略其他列。例如,对于查询: SELECT a,b FROM
2013-04-03 10:31:48 773
转载 Hive 随谈(四)– Hive QL
Hive 随谈(四)– Hive QL 原文地址:http://www.alidata.org/archives/581 Hive 的官方文档中对查询语言有了很详细的描述,请参考:http://wiki.apache.org/hadoop/Hive/LanguageManual ,本文的内容大部分翻译自该页面,期间加入了一些在使用过程中需要注意到的事项。 Create Table
2013-04-03 10:31:12 715
转载 Hive 随谈(三)– Hive 和数据库的异同
Hive 随谈(三)– Hive 和数据库的异同 原文地址:http://www.alidata.org/archives/551 摘要:由于 Hive 采用了 SQL 的查询语言 HQL,因此很容易将 Hive 理解为数据库。其实 从结构上来看,Hive 和数据库除了拥有类似的查询语言,再无类似之处。本文将 从多个方面来阐述 Hive 和数据库的差异。数据库可以用在 Online
2013-04-03 10:30:18 920
转载 Hive 随谈(二)– Hive 结构
Hive 随谈(二)– Hive 结构 原文地址:http://www.alidata.org/archives/499 Hive 体系结构 Hive 的结构如图所示, 主要分为以下几个部分: 用户接口,包括 CLI,Client,WUI。 元数据存储,通常是存储在关系数据库如 mysql, derby 中。 解释器、编译器、优化器、执行器。 Had
2013-04-03 10:29:21 639
转载 Hive 随谈(一)– Hive 入门
Hive 随谈(一)– Hive 入门 原文地址:http://www.alidata.org/archives/481 Hive 是什么 在接触一个新的事物首先要回到的问题是:这是什么? 这里引用 Hive wiki 上的介绍: Hive is a data warehouse infrastructure built on top of Hadoop. It
2013-04-03 10:28:12 994
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人