Hadoop | 基于Java语言的MapReduce操作案例 | 词频统计

最新推荐文章于 2023-02-06 21:54:19 发布

「已注销」

最新推荐文章于 2023-02-06 21:54:19 发布

阅读量928

点赞数

分类专栏： # 大数据原理与应用文章标签： hadoop mapreduce

本文链接：https://blog.csdn.net/Unirithe/article/details/116564018

版权

文章目录

运行环境
1. 启动Hadoop集群
2. 用eclipse创建java程序，导入jar包
- 2.1 编写Java程序并编译运行：
- 2.2 导出jar包
3. 上传测试文本到Hdfs
4. 测试运行jar包

运行环境

Ubuntu 16.04
Hadoop3.1.3
Jdk8
Eclipse 3.8.0
Hadoop伪分布式环境

1. 启动Hadoop集群

$ start-all.sh

检查hdfs是否启动成功

$ hdfs dfs -ls /

2. 用eclipse创建java程序，导入jar包

导入相关的jar包：
hadoop/share/hadoop/common/*.jar
hadoop/share/hadoop/mapreduce/*.jar
hadoop/share/hadoop/common/lib
在这里插入图片描述

在这里插入图片描述

配置eclipse的字体界面，便于代码编写
在这里插入图片描述

修改工作空间workplace的默认jdk版本

由于eclipse版本问题，每次创建的项目默认jdk为1.4，现对其进行设置，配置成统一的jdk版本，最高的为1.7，操作步骤如下图所示。
在这里插入图片描述

2.1 编写Java程序并编译运行：

import java.io.IOException;
import java.util.Iterator;
import java.util.StringTokenizer;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache

最低0.47元/天解锁文章

「已注销」

关注

0
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
Hadoop | 基于Java语言的MapReduce操作案例 | 词频统计

运行环境：Ubuntu 16.04Hadoop3.1.3Jdk8Eclipse 3.8.0Hadoop伪分布式环境文章目录1. 启动Hadoop集群2. 用eclipse创建java程序，导入jar包2.1 编写Java程序并编译运行：2.2 导出jar包3. 上传测试文本到Hdfs4. 测试运行jar包1. 启动Hadoop集群$ start-all.sh检查hdfs是否启动成功$ hdfs dfs -ls /2. 用eclipse创建java程序，导入jar包导入相关的ja.
复制链接

扫一扫