hive
文章平均质量分 91
zsq12138
这个作者很懒,什么都没留下…
展开
-
hive初体验
Hive 基于Hadoop的一个数据仓库工具,构建于hadoop的hdfs和mapred之上,用于管理和查询结构化/非结构化数据的数据仓库。可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。 Hive将HQL语句转译成M/R Job,然后按照MR的计算框架在Hadoop执行,也原创 2017-09-16 19:28:48 · 444 阅读 · 0 评论 -
hive加强
Hive介绍与实践查看执行计划explain select city_code,count(1) as cnt from user where access='WIFI' group by city_code order by cnt desc limit 5; MR Job的基本过程一个InputSplit输入到map,会运行我们实现的Mapper的处理逻辑,对数据进行映射操作。map输出原创 2017-09-17 19:51:46 · 375 阅读 · 0 评论