基于Netty从零实现MapReduece中WordCount案例、MIT 6.824 Java版

- Xu1Aan！

已于 2022-07-30 15:16:38 修改

阅读量532

点赞数

分类专栏：大数据 Hadoop 文章标签： mapreduce hadoop java

于 2022-07-13 17:02:16 首次发布

本文链接：https://blog.csdn.net/qq_43461159/article/details/125767930

版权

大数据同时被 2 个专栏收录

11 篇文章 1 订阅

订阅专栏

Hadoop

11 篇文章 0 订阅

订阅专栏

MapReduece

项目地址：https://github.com/Xu1Aan/MapReduece

项目简介🌟

本项目为Java从零实现MapReduce中的wordcount案例，应用到的技术由Netty框架。基于Netty实现了简单的wordcount案例。相较于单点MapReduece，分布式需要考虑更多的并发操作，以及不同节点之间的通信协议等因素。通过Netty提供的良好的异步编程、事件驱动能力，简化了网络应用（分布式应用）的编程开发过程。

项目说明⭐️

项目由两部分构成：master、worker

master主要负责任务管理，worker负责执行任务

项目所遇到的难点：

为不同worker分配任务时并发操作的编写时，最为重要的是，需要维护一个节点（worker）的状态链表。表明哪些worker当前可用；同时需要使用信号量保证多段代码不被并发调用。其次，需要基于Netty控制粘包、半包问题，本项目的做法时自定义了一个协议；网络传输需要序列化，在此使用gson序列化。

在这里插入图片描述

详细步骤：

master监听节点连接数量，当到达预设值时，开始执行mapreduce，
由于没有分布式文件系统（如HDFS等），所以有master去读取文件数据，通过RPC调用不同worker执行Splitting和Mapping操作。
最后master节点负责shuffle和reduce操作（这里可以改一下）。

启动⭐️

application.propertoes配置项说明：

serializer.algorithm=Json //选择序列化格式
netty.maxFrameLength=131072 //设置netty最大帧长度
com.xu1an.mrapp.IMapReduce=com.xu1an.mrapp.WordCount //设置MapReduce的实现类
map.nums=2 //设置map数量
reduce.nums=1

master启动地址：com.xu1an.master.Master

worker启动地址: com.xu1an.worker.Worker

🔆在上述配置下，需要启动两个worker。在idea中需要对worker配置（configurations）设置：

选择Modify -> Allow multiple instances。

- Xu1Aan！

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
基于Netty从零实现MapReduece中WordCount案例、MIT 6.824 Java版

java从零实现MapReduce中的wordcount案例，基于Netty的Map Reduce实现，Mit 6.824 java 版.
复制链接

扫一扫