Hive
游侠509
在知识的海洋面前,我只是一个在沙滩上玩耍的小孩子。
展开
-
Hive学习路线图(转)
1 Comment Hive学习路线图 Hadoop家族系列文章,主要介绍Hadoop家族产品,常用的项目包括Hadoop, Hive, Pig, HBase, Sqoop, Mahout, Zookeeper, Avro, Ambari, Chukwa,新增加的项目包括,YARN, Hcatalog, Oozie, Cassandra, Hama, Whirr, Flume, B转载 2017-02-06 11:56:17 · 246 阅读 · 0 评论 -
Hive操作
数据操作能力是大数据分析至关重要的能力。数据操作主要包括:更改(exchange),移动(moving),排序(sorting),转换(transforming)。Hive提供了诸多查询语句,关键字,操作和方法来进行数据操作。一、 数据更改 数据更改主要包括:LOAD, INSERT, IMPORT, and EXPORT1. LOAD DATA load关键字的作用是将数据移动到hive中。如果转载 2017-03-19 16:33:59 · 703 阅读 · 0 评论 -
Hive报错
Logging initialized using configuration in jar:file:/cloud/apache-hive-0.13.0-bin/lib/hive-common-0.13.0.jar!/hive-log4j.properties Exception in thread "main" java.lang.RuntimeException: java.lang.Ru原创 2017-03-12 17:21:40 · 387 阅读 · 0 评论 -
数据仓库
1. 什么是数据仓库 1.1 数据仓库的概念 官方定义 数据仓库是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合,用于对管理决策过程的支持。 这个定义的确官方,但是却指出了数据仓库的四个特点。 特点 面向主题:数据仓库都是基于某个明确主题,仅需要与该主题相关的数据,其他的无关细节数据将被排除掉 集成的:从不同的数据源采集数据到同一个数转载 2017-04-03 20:12:20 · 484 阅读 · 0 评论