目录
0、什么是Hive
0.1 Hive简介
Hive是由Facebook开源,基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。
那为什么会有Hive呢?它是为了解决什么问题而诞生的呢?下面通过一个案例,来快速了解一下Hive。例如:需求,统计单词出现个数。
(1)如果用MapReduce程序实现的,需要编写Mapper、Reducer和Driver三个类,相对繁琐。
test表
id列
atguigu
atguigu
ss
ss
jiao
banzhang
xue
hadoop
(2)如果通过Hive SQL实现,一行就搞定了,简单方便,容易理解。
select count(*) from test group b