![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
机智陆小胖
这个作者很懒,什么都没留下…
展开
-
Hadoop教程 | 第二篇:上传数据文件,运行wordcount示例
前言上一篇中我们安装了Hadoop3.x,并搭建了伪分布式集群。本篇我们学习一下Hadoop的HDFS的基本指令,将一个单词的数据文件上传至HDFS,并使用Hadoop样例库中的统计单词算法,通过MapReduce统计出每个单词出现的次数。操作系统 JAVA Hadoop 辅助连接工具 CentOS7.4 JDK1.8 3.2.0 PuTTY、Win...原创 2019-08-08 11:52:04 · 1930 阅读 · 0 评论 -
Hadoop教程 | 第三篇:Java编写统计词数的MapReduce程序并执行
前言上一篇中我们通过指令将文件上传至HDFS,为了方便操作,可使用HDFS桌面可视化连接工具进行文件管理,我使用的HDFS Explorer。下载安装参考地址:https://www.cnblogs.com/yangcx666/p/8723888.html。当然我们也可以在eclipse或者idea上安装HDFS插件,直接管理。在上一篇中,我们直接运行了hadoop的词数统计实例,本篇将模...原创 2019-08-08 22:22:06 · 622 阅读 · 0 评论 -
Hadoop教程 | 第一篇:CentOS7安装Hadoop3.0 | 伪分布式
前言教程使用阿里云服务器,CentOS7.4操作系统。在对linux有一定的基础前提下,搭建起来会很轻松。如果没有linux基础,在使用教程中指令时可以先自行查一下指令的用法说明。教程中也会尽量照顾到没有linux基础或基础比较薄弱的小伙伴,没有基础的小伙伴也无需担心,依照教程一样可以搭建完成。操作系统 JAVA Hadoop 辅助连接工具 CentOS7.4 ...原创 2019-08-07 14:01:15 · 615 阅读 · 0 评论