利用HiveQL实现WordCount

最新推荐文章于 2022-10-26 10:08:14 发布

BetterMan1999

最新推荐文章于 2022-10-26 10:08:14 发布

阅读量455

点赞数

分类专栏：大数据文章标签： Hive HiveQL

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mjb740074431/article/details/102963189

版权

大数据专栏收录该内容

4 篇文章 0 订阅

订阅专栏

在本地文件夹中新建两个文件file1.txt,file2.txt，并输入内容
在终端开启hadoop,hbase服务
start-dfs.sh
start-hbase.sh

3.将file1.txt file2.txt上传到HDFS

 hdfs dfs -put /usr/local/hadoop/input/file1.txt /input
 hdfs dfs -put /usr/local/hadoop/input/file2.txt /input

在这里插入图片描述
4.进入Hive端创建表，将数据存入表并利用MapReduce统计单词

creat table docs(line string);

load data inpath '/input' overwrte into table docs;

create table word_count as 
select word, count(1) as count from
(select explode(split(line,' '))as word from docs) w
group by word
order by word;

在这里插入图片描述

5.使用select语句查询

select * from word_count;

在这里插入图片描述
结果正确，word_count执行成功

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
利用HiveQL实现WordCount

在本地文件夹中新建两个文件file1.txt,file2.txt，并输入内容在终端开启hadoop,hbase服务start-dfs.shstart-hbase.sh3.将file1.txt file2.txt上传到HDFS hdfs dfs -put /usr/local/hadoop/input/file1.txt /input hdfs dfs -put /usr/loc...
复制链接

扫一扫

专栏目录

BetterMan1999 CSDN认证博客专家 CSDN认证企业博客

码龄7年

63: 原创

3万+: 周排名

148万+: 总排名

43万+: 访问

: 等级

2356: 积分

695: 粉丝

1077: 获赞

277: 评论

7393: 收藏

私信

关注

热门文章

分类专栏

算法 18篇
JVM 3篇
Java 7篇
数据中台 1篇
Git 3篇
中间件 4篇
Raspberry Pi 2篇
开发工具 3篇
Linux 2篇
SSM框架 4篇
基础 4篇
大数据 4篇
数据库 13篇

最新评论

数据库课程设计 ——酒店管理系统
东林潇雨: 不知道呀
数据库课程设计 ——酒店管理系统
张龙773: 有报酬
数据库课程设计 ——酒店管理系统
张龙773: 哪位大佬做好了，求
生产上的一次慢查询SQL优化
BetterMan1999: 当时sql中的productCode个数大概20+个，几乎包含了表中所有的productCode，至于您说的量很大的时候会导致索引失效，这个我确实在生产上没遇到过，可能是我的版本不同或数据量比较少，还没超过优化器的限制，也可能跟我productCode是个枚举值有关，但我的本意也是在有更合适的索引前提下不走枚举值的索引。我之前看过《高性能Mysql》一书中有提过这样一句话，或许对您有所帮助。”MySQL将IN()列表中的数据先进行排序，然后通过二分查找的方式来确定列表中的值是否满足条件，这是一个O（logn）复杂度的操作，等价地转换成OR查询的复杂度为O（n），对于IN()列表中有大量取值的时候，MySQL的处理速度将会更快。“因此我理解在不超过in的极限下，用in或许是个更好的选择。
数据库课程设计 ——酒店管理系统
impp: 同问，你搞定了吗

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。