hadoop生态
文章平均质量分 87
legotime
这个作者很懒,什么都没留下…
展开
-
HiveQL数据定义
hive 是一个基于hadoop、处理结构化数据的数据仓库基础工具。它提供简单的sql查询功能可以将sql语句转换为MapReduce任务进行运行hadoop是一个开源的大型分布式处理框架,主要包含了两个模块,MapReduce和HDFS-----MapReduce:它是一种并行编程模型在大型集群普通硬件可用于处理大型结构化,半结构化和非结构化数据。-----HDFS:Ha原创 2016-04-27 18:38:04 · 1633 阅读 · 0 评论 -
ubuntu下Hive安装
Hive安装和配置实践(1.2.1版本)1:直接从官网(hive.apache.org)下载Hive,解压到你想要的文件夹下2:环境设置:export HIVE_HOME=/usr/local/hive/apache-hive-1.2.1-binexport HIVE_CONF_DIR=$HIVE_HOME/confexport PATH下增加hive的bi原创 2016-03-22 19:50:40 · 767 阅读 · 0 评论 -
SparkSQL和Hive自定义函数对比
一、UDFUDF(User-Defined Function),指的是一个输入,一个输出Hive环境下1、准备数据Michael, 29Andy, 30Justin, 192、上传HDFS原创 2017-02-10 16:41:39 · 1608 阅读 · 0 评论