实现MapReduce程序完成单词统计

一、目的

理解MapReduce在Hadoop体系结构中的角色,通过该实验后,能设计开发简单的MapReduce程序。

二、设备

计算机:CPU四核i7 6700处理器;内存8G; SATA硬盘2TB硬盘; Intel芯片主板;集成声卡、千兆网卡、显卡; 20寸液晶显示器。
编译环境:(1)操作系统:Linux (2)Hadoop版本:2.7.2 机器:虚拟机3台 (3)Eclipse 4.7

三、内容

3.1启动Hadoop服务

(1)格式化namenode。
(2)启动Hadoop。

[root@hadoop101 ~]# cd /opt/module/hadoop-2.7.2/
[root@hadoop101 hadoop-2.7.2]# sbin/./start-all.sh

1
(3)用jps验证服务器服务是否启动成功。

[root@hadoop101 hadoop-2.7.2]# jps

2
3
4

3.2开发LineCount程序

(1)打开Eclipse开发工具,新建Maven项目。
5
6
7

8
(2)WORDCOUNT代码
WordCountMapper:

package com.lizi.mr;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;
import java.io.IOException;
public class WordCountMapper extends Mapper<LongWritable, Text, Text, IntWritable> {
   
    @Override
    protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
   
        //拿到输入的这行数据
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值