hadoop系列
iteye_10652
这个作者很懒,什么都没留下…
展开
-
hive001-hive简介
01,hive是apache hadoop项目的一个子项目,facebook和淘宝都是其贡献者和使用者。02,hive是一个数据仓库工具(见hive002-数据仓库简介)03,hive构建于hadoop之上04,hive将结构化的关系数据提取转换加载到hive中,hive可以方便处理这些大容量的数据05,hive通过ql语言来查询hive中的数据06,mapreduce应用可以...原创 2012-07-27 09:42:40 · 510 阅读 · 0 评论 -
hive002-数据仓库简介
01,数据仓库是决策支持系统(dss)(见hive003-决策支持系统)和联机分析应用数据源(见hive004-联机分析数据源)的结构化数据环境。原创 2012-07-27 09:49:00 · 70 阅读 · 0 评论 -
hive003-决策支持系统
01,决策支持系统(decision support system ,简称dss)是辅助决策者通过数据、模型和知识,以人机交互方式进行半结构化或非结构化决策的计算机应用系统。它是管理信息系统(mis)向更高一级发展而产生的先进信息管理系统。它为决策者提供分析问题、建立模型、模拟决策过程和方案的环境,调用各种信息资源和分析工具,帮助决策者提高决策水平和质量。...原创 2012-07-27 09:52:30 · 148 阅读 · 0 评论 -
hive004-联机分析数据源
1,原创 2012-07-27 09:56:16 · 115 阅读 · 0 评论 -
hive005-hive安装和配置(安装环境准备)
01,原创 2012-07-27 11:06:33 · 68 阅读 · 0 评论 -
hive006-hive安装和配置
01,原创 2012-07-28 17:35:55 · 86 阅读 · 0 评论 -
hadoop生态图谱
当下Hadoop已经成长为一个庞大的体系,貌似只要和海量数据相关的,没有哪个领域缺少Hadoop的身影,下面是一个Hadoop生态系统的图谱,详细的列举了在Hadoop这个生态系统中出现的各种数据工具。 1.这一切,都起源自Web数据爆炸时代的来临 2.数据抓取系统 - Nutch 3.海量数据怎么存,当然是用分布式文件系统 - HDFS 4.数据怎么用呢,分析,处理 5.Ma...原创 2012-08-13 17:11:36 · 140 阅读 · 0 评论