2.Flink RPC源码分析

源码视频课程(连载中):

https://edu.csdn.net/course/detail/39418

1. 本次内容预告

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

1.Akka、Pekko基本使用
2.Flink Rpc底层实现(RpcService、RpcServer、RpcGateway、RpcEndpoint)
核心:彻底理解Flink RPC底层是如何通信的

2、相关联的知识点

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

1.ResourceManager:主要负责Flink集群中的计算资源,其中计算资源主要来自TaskManager注册。
2.TaskManager(TaskExecutor):TaskManager负责向整个集群提供Slot计算资源。TaskManager会调用registerTaskExecutor()方法向ResourceManager注册.
registerTaskExecutor 注册成功以后调用sendSlotReport汇报slot资源

3、本节详细内容

3.1.RPC概念

RPC,即远程过程调用(Remote Procedure Call),是一种通过网络从远程计算机程序上请求服务的技术,而无需了解底层网络技术的协议。在RPC中,客户机和服务器位于不同的机器上,客户端通过网络调用在服务器端运行的过程,并将结果发送回客户机。这种技术允许程序像调用本地过程一样调用远程过程,使得跨平台、跨机器的服务调用成为可能。

1.两个进程间的相互调用

2.集群中不同节点服务的通信

3.2.大数据组件常见的RPC实现技术

序号

生态圈技术

RPC实现

1

Hadoop

NIO

2

Spark

Spark1(Akka),Spark2(Netty)

3

Flink

Akka+Netty(Pekko+Netty)

3.3.Pekko(Akka)

3.3.1. Akka、Pekko基本概念

Flink1.18版本内部RPC通信封装用的是Apache Pekko。Apache Pekko是Akka 2.6.x的一个分支。为什么会改因为Akka将来Apache许可证更改为Business Source License (BSL) v1.1,该协议不是开源的。

Akka、Pekko 用于构建高并发、分布式、可容错、事件驱动的开发库。

1、提供基于异步非阻塞、高性能的事件驱动编程模型

2、轻量级的事件处理(每GB堆内存几百万Actor)

3、使用Akka可以在单机上构建高并发程序,也可以在网络中构建分布式程序。

注意:Akka是基于Actor模型的并发框架,每个Actor的实例在运行时只占用非常少的资源,大约只有300字节。这意味着在1G的内存中可以容纳接近300万个Actor,这使得Akka在处理大量并发请求时能够保持高效的内存使用。

1、ActorSystem 是管理 Actor 生命周期的组件,Actor 是负责进行通信的组件

2、每个 Actor 都有一个 MailBox,别的 Actor 发送给它的消息都首先储存在 MailBox 中,通过这种方式可以实现异步通信。

3、每个 Actor 是单线程的处理方式,不断的从 MailBox 拉取消息执行处理,所以对于 Actor 的消息处理,不适合调用会阻塞的处理方法。

4、Actor 可以改变他自身的状态,可以接收消息,也可以发送消息,还可以生成新的 Actor

5、每一个 ActorSystem 和 Actor都在启动的时候会给定一个 name,如果要从 ActorSystem 中,获取一个 Actor,则通过以下的方式来进行 Actor 的

获取:pekko.tcp://flink@localhost:6123/user/rpc/resourcemanager_* 来进行定位

6、如果一个 Actor 要和另外一个 Actor 进行通信,则必须先获取对方 Actor 的 ActorRef 对象,然后通过该对象发送消息即可。

7、通过 tell 发送异步消息,不接收响应,通过 ask 发送异步消息,得到 Future 返回,通过异步回到返回处理结果。

3.3.2.Pekko Demo事例

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

package com.source.pekko;

import lombok.AllArgsConstructor;
import lombok.Data;
import lombok.NoArgsConstructor;

@Data
@AllArgsConstructor
@NoArgsConstructor
public class PekkoData {
    private String info;
}

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

package com.source.pekko;

import org.apache.pekko.actor.AbstractActor;
import org.apache.pekko.actor.ActorRef;
import org.apache.pekko.japi.pf.ReceiveBuilder;

/**
 * 继承AbstractActor定义自己的actor
 * Actor可以发送和接收消息
 */
public class PekkoRpcActor extends AbstractActor {
    /**
     * 实现接收消息
     * @return
     */
    @Override
    public Receive createReceive() {
        return ReceiveBuilder.create()
                /**接收到PekkoData消息交给handleMessage处理
                 * flink PekkoRpcActor 155行也是这样处理的
                 */
                .match(PekkoData.class, this::handleMessage)
                .build();
    }

    /**
     * 处理具体消息
     * @param message
     */
    private void handleMessage(final PekkoData message) {
        /** 获取发送者,发送者对应的就是actorRef */
        ActorRef sender = getSender();
        ActorRef self = getSelf();
        /** 打印 */
        System.out.println(sender + ":发送者=>" + message.getInfo());
        /** 回复消息 向发送者sender 回复word 的消息 回复者是当前actorRef*/
        /** 4、Actor 可以改变他自身的状态,可以接收消息,也可以发送消息,还可以生成新的 Actor  */
        sender.tell(new PekkoData("PekkoRpcActor-word"),self);

    }
}

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

package com.source.pekko;

import org.apache.pekko.actor.AbstractActor;
import org.apache.pekko.actor.ActorRef;
import org.apache.pekko.japi.pf.ReceiveBuilder;

/**
 * 继承AbstractActor定义自己的actor
 * Actor可以发送和接收消息
 */
public class PekkoRpcSenderActor extends AbstractActor {
    /**
     * 实现接收消息
     * @return
     */
    @Override
    public Receive createReceive() {
        return ReceiveBuilder.create()
                /**接收到PekkoData消息交给handleMessage处理
                 * flink PekkoRpcActor 155行也是这样处理的
                 */
                .match(PekkoData.class, this::handleMessage)
                .build();
    }


    private void handleMessage(final PekkoData message) {
        /** 获取发送者,发送者对应的就是actorRef */
        ActorRef sender = getSender();
        /** 打印 */
        System.out.println(sender + ":接收到=>" + message.getInfo());

    }
}

--javascripttypescriptbashsqljsonhtmlcssccppjavarubypythongorustmarkdown

package com.source.pekko;

import lombok.val;
import org.apache.pekko.actor.ActorRef;
import org.apache.pekko.actor.ActorSystem;
import org.apache.pekko.actor.Props;

public class Demo {
    public static void main(String[] args) {
        /**创建actorSystem*/
        ActorSystem actorSystem = ActorSystem.create("flink");
        /**构建PekkoRpcActor的ActorRef*/
        ActorRef pekkoRpcRef = actorSystem.actorOf(Props.create(PekkoRpcActor.class), "PekkoReceive");
        /**构建PekkoRpcSenderActor的ActorRef*/
        ActorRef pekkoRpcSenderRef = actorSystem.actorOf(Props.create(PekkoRpcSenderActor.class), "PekkoRpcSenderActor");
        /** pekkoRpcSenderActor作为发送者 向PekkoRpcActor发送 hello*/
        pekkoRpcRef.tell(new PekkoData("hello"),pekkoRpcSenderRef);
    }
}

运行结果

3.4.Flink RPC通信

Flink RPC底层对Pekko API进行了封装

假设设计一个TaskExecutor进程 向ResourceManager进程注册,如何设?

1.TaskManager、ResourceManager要是可以进行通信的(RpcEndpoint

1.TaskManager要能获取到ResourceManager的代理对象(TaskExecutorGateway、ResourceManagerGateway)

2.TaskManager获取到代理对象之后要知道调用ResourceManager的那个方法进行注册(ResourceManagerGateway.registerTaskExecutor

3.要实现有能连接ResourceManager进程的通信服务(RpcService)

4.建立通信连接后要有能处理消息的公共类(PekkoRpcActor)

5.满足以上条件了,就相当于TaskManager、ResourceManager本身就是一个可以通信的进程,本地通信 自己与自己通信(RpcServer)

基于上面的设计,我们从Flink代码中可以找到对应的实现类、接口

RpcGateway

用于远程调用的代理接。RpcGateway 提供了获取其所代理的 RpcEndpoint 的地址的方法。在实现一个提供 RPC 调用的组件 时,通常需要先定一个接口,该接口继承 RpcGateway 并约定好提供的远程调用的方法。看源码继承实现RpcGateway需要定义有远程调用的方法 ResourceManagerGateway

RpcEndpoint

对 RPC 框架中提供具体服务的实体的抽象,所有提供远程调用方法的组件都需要继承该抽象类。另外,对于同一个 RpcEndpoint 的所有 RPC 调用都会在同一个线程(RpcEndpoint 的“主线程”)中执行,因此无需担心并发执行的线程安全问题。看源码,如果要进行通信就要实现RpcEndpoint,相当于消息通信实体

RpcService

是 RpcEndpoint 的运行时环境,  RpcService 提供了启动 RpcEndpoint , 连接到远端 RpcEndpoint 并返回远端 RpcEndpoint 的代 理对象等方法。此外,  RpcService 还提供了某些异步任务或者周期性调度任务的方法。内部包装了 ActorSystem 看源码,内部对ActorSystem封装,内部通过动态代理构建代理实现,以及远程连接RpcEndpoint进行消息发送

RpcServer

相当于 RpcEndpoint 自身的的代理对象(self gateway)。 RpcServer 是 RpcService 在启动了 RpcEndpoint 之后返回的对象,每 一个 RpcEndpoint 对象内部都有一个 RpcServer 的成员变量,通过 getSelfGateway 方法就可以获得自身的代理,然后调用该Endpoint 提供的服务。看源码RpcEndpoint实现启动的时候会调用

PekkoRpcActor

继承AbstractActor 接收到的消息进行处理,handleMessage根据消息类型就行处理。

3.5.TaskExecutor向ResourceManager注册 debug

TaskExecutor创建对象启动的时候会触发 onStart方法

Flink 内部所有的RpcEndpoint 实现(TaskExecutor,ResourceManager、JobMaster)等第一次启动都会触发Onstart方法的执行,这是pekko的内部机制如愿以偿进入最终我们预想的方法。

以上就是Flink RPC底层通信。你理解了吗?

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

星&脉

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值