学习大数据,入门的第一个案例想必就是wordcount了吧,学习hadoop的时候采用编写mapreduce程序的方式来实现,学习hive的时候可以通过编写HQL来实现。
第一步:准备数据
第二步:创建数据库表
第三步:向表中导入数据
第四步:编写HQL
select
word,count(1) as count
from
(select
explode(split(line,',')) as word
from
docs) w
group by word
order by word;
结果: