如何使用hive进行wordcount统计
如下图,我们先在hive中建一张名为wc的表,里面只有一个字段,包含以逗号隔开的数据
然后使用函数split , explode,count,group by进行统计
1、 先使用split将每行数据切开,这里是用逗号分隔
select split(tence,',') from wc;
2、再用explode函数将每个数据处理成一行,即每行只有一条数据
select explode(split(tence,',')) from wc;
3、这时,就可以进行wordcount统计了
select word,count(*) from(
select explode(split(tence,',')) as word from wc) t group by word;