Hive实现wordCount

最新推荐文章于 2023-05-04 12:12:49 发布

「已注销」

最新推荐文章于 2023-05-04 12:12:49 发布

阅读量316

点赞数

分类专栏：大数据文章标签： hive wordcout

本文链接：https://blog.csdn.net/Arne_/article/details/93894437

版权

本文介绍了如何在Hive中实现wordCount操作。首先创建一个数据库，然后建表存储数据。接着根据MapReduce原理，利用explode和split函数拆分单词。最后通过group by进行单词计数，展示出Hive在大数据统计上的便捷性。

摘要由CSDN通过智能技术生成

a. 创建一个数据库

create database word;

b. 建表

create external table word_data(line string) row format delimited fields terminated by '\n' stored as textfile location '/home/hadoop/worddata';
这里假设我们的数据存放在hadoop下，路径为：/home/hadoop/worddata，里面主要是一些单词文件，内容大概为：

+-------------------------+--+
|     word_data.line      |
+-------------------------+--+
|                         |
| hello man               |
| what are you doing now  |
| my running              |
| hello                   |
| kevin                   |
| hi man                  |
| hadoop hive es          |
| storm hive es           |
|

最低0.47元/天解锁文章

「已注销」

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Hive实现wordCount

a. 创建一个数据库create database word;b. 建表create external table word_data(line string) row format delimited fields terminated by '\n' stored as textfile location '/home/hadoop/worddata';这里假设我们的数据存放在had...
复制链接

扫一扫

专栏目录