Actor模型与Akka Actor体系基础总结

点击上方蓝色字体,选择“设为星标

回复”资源“获取更多资源

大数据技术与架构

点击右侧关注,大数据开发领域最强公众号!

大数据真好玩

点击右侧关注,大数据真好玩!

前言

最近用业余时间把Flink的RPC基础设施翻了个底朝天,又与之前分析过的Spark RPC机制做了一些对比,越发觉得Actor模型甚为精妙,值得简单记录一下,顺便也可作为日后解析Flink RPC机制的基础入门。

Actor模型

Actor模型由Hewitt、Bishop和Steiger在1973年通过论文《A Universal Modular Actor Formalism for Artificial Intelligence》提出,是一个创新的并发、分布式计算和编程模型。该模型的理念是“万物皆Actor”,即以Actor作为最基本的功能单元,且需要遵循以下几个基本规则。

  • 所有的计算都是在Actor中执行的。

  • Actor之间只能通过消息进行通信,且消息是不可变的。

  • Actor串行处理并响应消息。当一个Actor响应消息时,它可以进行下列操作:

      *     更改状态或行为;
      *     发送有限数量的消息给其他Actor;
      *     创建有限数量的子Actor。
    

Actor一词在此语境下仍然没有确定的中文译名,有人把它翻译为“角色”,大致贴切。

一个符合Actor模型的简单系统如下图所示。Actor本质上是状态、行为、邮箱三要素的集合。

  • 状态(State):Actor内部维护的变量及数据。每个Actor都单独维护自己的状态,与其他Actor隔离。

  • 行为(Behavior):Actor内部定义的一组计算逻辑(如函数),用于处理接收到的消息以及改变状态数据。

  • 邮箱(Mailbox):可以视为与接收方Actor关联的FIFO消息队列。由于Actor串行处理消息,发送方发来的来不及处理的消息会存入邮箱中,接收方再从邮箱逐条获取pending的消息。(当然,一个Actor既可以是发送方也可以是接收方)

可见,Actor模型另辟蹊径解决了并发环境中最棘手的问题,即共享数据的问题。在传统方案中,总需要通过同步机制(锁、信号量、原子性内存操作等)保证共享数据的一致性。但是同步操作的开销都比较大,往往会拖累高并发情况下的性能表现,并且容易引起死锁等其他问题。而Actor模型纯依赖消息传递,消息可以异步、非阻塞地处理,且状态是隔离的,不需要再考虑同步,简单而高效。

当然,Actor的结构也很简洁,单个Actor只需利用单线程执行,所以非常轻量级,1GB的内存可以容纳上百万的Actor实例。

Actor模型有众多成熟的实现,例如Erlang语言的并发机制就是完全基于它来实现的。接下来简要介绍Akka,它是目前最活跃的Actor模型开源项目之一,同时也是Flink RPC的基础。而Spark的旧版本同样使用Akka构建其RPC体系,后来的新版本虽然换用了Netty,但其设计理念仍然可以近似视为简化版的Akka。

Akka Actor体系

Akka官网首页的介绍如下。

高并发、分布式、弹性、消息驱动、基于JVM,这就是Akka的五个关键词,可见是深得Actor模型的精髓。

整个Akka生态分为很多库(也叫模块),如:Actor、Remoting、Cluster、Persistence、Streams、HTTP等。当然,Actor库是Akka核心中的核心,下面也仅简要总结与Actor库相关的基础知识。

Akka Actor是按照树形层次结构来组织的,其关系示意图如下所示。

Akka通过Actor系统(ActorSystem)来管理所有Actor,每个JVM实例内只有一个ActorSystem。当ActorSystem启动时,默认有3个守护(guardian)Actor:

  • /:根守护Actor,如同文件系统中的根,最先被创建,最后被销毁;

  • /system:系统守护Actor,Akka本身以及基于Akka构建的某些模块会在该路径下创建子Actor;

  • /user:用户守护Actor,我们在使用Akka过程中创建的Actor都会位于这个路径下。当调用ActorSystem.actorOf()方法时,会在/user下直接创建;而当调用某Actor的ActorContext.actorOf()方法时,会在该Actor下创建子Actor。

创建或者根据路径查找Actor,返回给用户的都是ActorRef,可以视为Actor实例的不可变、可序列化的句柄(引用),用户通过ActorRef来操作Actor,比如向其发送消息。

下图示出Actor从低级到高级的三层抽象,即Actor、ActorContext和ActorRef,以及它们对应的路径ActorPath。

可见,Actor的实际层级关系维护在上下文实例ActorContext中(ActorContext也包含有向当前Actor发送消息的那个ActorRef),而Actor的路径则维护在ActorRef中。这样就保证了从属于不同ActorSystem的Actor之间可以正常通信。

Actor的层次结构同时也是监督(supervision)机制的基础。当一个Actor失败时,它会通知其父Actor采取相应的动作(如直接恢复、重启、停止或者将失败信息继续向高层传递)。下图示出一个Akka Actor的完整生命周期。

可见,Akka还提供了一些生命周期的触发器方法(称为hook/钩子),用户可以通过重写这些方法来管理Actor的生命周期。特别需要注意的是,如果一个Actor停止,那么它的所有子Actor也会随着停止。

最后有一个问题,整个ActorSystem是如何被驱动的呢?答案是依靠一个中心化组件——Dispatcher(调度器/分发器),负责将Actor和与其关联的邮箱中的消息调度到线程中进行处理。它的原理并不难,形象的图示如下,就不多废话了。

版权声明:

本文为大数据技术与架构整理,原作者独家授权。未经原作者允许转载追究侵权责任。

编辑|冷眼丶

微信公众号|import_bigdata

欢迎点赞+收藏+转发朋友圈素质三连

文章不错?点个【在看】吧! ????

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值