基于Netty从零实现MapReduece中WordCount案例、MIT 6.824 Java版

MapReduece

项目地址:https://github.com/Xu1Aan/MapReduece

项目简介🌟

本项目为Java从零实现MapReduce中的wordcount案例,应用到的技术由Netty框架。基于Netty实现了简单的wordcount案例。相较于单点MapReduece,分布式需要考虑更多的并发操作,以及不同节点之间的通信协议等因素。通过Netty提供的良好的异步编程、事件驱动能力,简化了网络应用(分布式应用)的编程开发过程。

项目说明⭐️

项目由两部分构成:master、worker

master主要负责任务管理,worker负责执行任务

项目所遇到的难点:

为不同worker分配任务时并发操作的编写时,最为重要的是,需要维护一个节点(worker)的状态链表。表明哪些worker当前可用;同时需要使用信号量保证多段代码不被并发调用。其次,需要基于Netty控制粘包、半包问题,本项目的做法时自定义了一个协议;网络传输需要序列化,在此使用gson序列化。

在这里插入图片描述

详细步骤:

  1. master监听节点连接数量,当到达预设值时,开始执行mapreduce,
  2. 由于没有分布式文件系统(如HDFS等),所以有master去读取文件数据,通过RPC调用不同worker执行Splitting和Mapping操作。
  3. 最后master节点负责shuffle和reduce操作(这里可以改一下)。

启动⭐️

application.propertoes配置项说明:

serializer.algorithm=Json //选择序列化格式
netty.maxFrameLength=131072 //设置netty最大帧长度
com.xu1an.mrapp.IMapReduce=com.xu1an.mrapp.WordCount //设置MapReduce的实现类
map.nums=2 //设置map数量
reduce.nums=1

master启动地址:com.xu1an.master.Master

worker启动地址: com.xu1an.worker.Worker

🔆在上述配置下,需要启动两个worker。在idea中需要对worker配置(configurations)设置:

​ 选择Modify -> Allow multiple instances。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值