Netflix前端应用采用六角体系架构来应对数据源替换

最新推荐文章于 2021-10-31 14:52:09 发布

m0_37411791

最新推荐文章于 2021-10-31 14:52:09 发布

阅读量346

点赞数

原文：Ready for changes with Hexagonal Architecture

作者：Damir Svrtan，Sergii Makagon

翻译：奶爸码农

随着Netflix Originals的业务逐年增长，我们需要构建可在整个创作过程中提高效率的应用程序。我们更广泛的Studio研发工程组织已构建了许多应用程序，涵盖创造内容从剧本到播放全流程：从脚本内容获取，交易谈判和供应商管理到日程安排，简化制作工作流程等。

从一开始就高度集成

大约一年前，我们的Studio Workflows工程团队开始开发跨业务多个领域的新应用。我们面临着一个有趣的挑战：我们需要从头开始构建应用程序的核心，但是我们还需要许多不同系统中已经存在的数据。

我们需要的一些数据源，例如电影，制作日期，员工和拍摄地点的数据，分布在实现各种协议的许多服务中：gRPC，JSON API，GraphQL等。现有数据对于我们应用程序的行为和业务逻辑至关重要。我们从一开始就需要高度集成。

可替换的数据源

早期，我们将产品作为一个巨石应用来进行开发，巨石应用开发模式可以保证快速的开发和快速的迭代。某一时刻，有30多个开发人员正在使用它，并且它具有300多个数据库表。

随着时间的流逝，应用程序从广泛的服务产品演变为高度定制化的产品。这导致决定将巨石应用分解为特定的服务。该决定并非针对性能问题，而是针对所有这些不同领域设置了界限，并使专门团队能够独立开发针对特定领域的服务。

整体仍然提供了我们为新应用所需的大量数据，但我们知道巨石应用将在某个时候拆分。我们不确定拆分的时间，但是我们知道拆分是不可避免的，我们需要做好准备。因此，我们一开始可以利用来自巨石应用的某些数据，因为它们仍然是数据的来源，但要准备将这些数据源一上线就交换给新的微服务。

采用Hexagonal Architecture（六角架构）

我们需要支持在不影响业务逻辑的情况下替换数据源的能力，因此我们知道我们需要保持它们之间的分离。我们决定根据Hexagonal Architecture背后的原理来构建我们的应用程序。

Hexagonal Architecture的思想是将输入和输出置于我们设计的边缘。业务逻辑不应取决于我们是否公开REST或GraphQL API，也不应该取决于我们从何处获取数据-数据库，通过gRPC或REST公开的微服务API，或仅是简单的CSV文件。

该模式使我们能够将应用程序的核心逻辑与外界的关注隔离开。将我们的核心逻辑隔离开意味着我们可以轻松更改数据源详细信息，而不会造成重大影响或无需将主要代码重写为代码库。

我们在拥有清晰边界的应用程序中也看到的主要优势之一就是测试策略-我们的大多数测试都可以验证我们的业务逻辑，而无需依赖可以轻松更改的协议。

核心概念

借鉴六角体系结构，定义我们的业务逻辑的三个主要概念是实体（Entity），存储库（Repositories）和交互器（Interactors）。

实体是领域对象（例如电影或拍摄地点），它们不知道它们的存储位置（与Ruby on Rails中的Active Record或Java Persistence API不同）。

存储库是获取实体以及创建和更改实体的接口。它们保留用于与数据源通信并返回单个实体或实体列表的方法列表。（例如UserRepository）

交互器是用于编排和执行领域操作的类-考虑服务对象或用例对象。他们实施特定于域操作的复杂业务规则和验证逻辑（例如，将产品投入生产）

使用这三种主要类型的对象，我们能够定义业务逻辑而无需任何知识或关心数据保存在何处以及如何触发业务逻辑。业务逻辑之外是数据源和传输层：

数据源是不同存储实现的适配器。

数据源可能是SQL数据库的适配器（Rails中的Active Record类或Java中的JPA），弹性搜索适配器，REST API，甚至是诸如CSV文件或Hash之类的简单适配器。数据源实现在存储库上定义的方法，并存储获取和推送数据的实现。

传输层可以触发交互器执行业务逻辑。我们将其视为系统的输入。微服务最常见的传输层是HTTP API层和一组处理请求的控制器。通过将业务逻辑提取到交互器中，我们不会耦合到特定的传输层或控制器实现。交互器不仅可以由控制器触发，还可以由事件，cron作业或命令行触发。

使用传统的分层体系结构，我们将使所有依赖项指向一个方向，上面的每一层都取决于下面的层。传输层将取决于交互层，交互层将取决于数据层。

在“六角体系结构”中，所有依赖点都向内指向-我们的核心业务逻辑对传输层或数据源一无所知。传输层仍然知道如何使用交互器，数据源知道如何符合存储库接口。

这样，我们就可以为不可避免的对其他Studio系统的更改做好准备，并且只要需要进行更改，就很容易完成交换数据源的任务。

数据源替换

交换数据源的需求比我们预期的要早-我们突然遇到了整体的读取限制，并且需要将某个实体的特定读取切换到通过GraphQL聚合层公开的较新的微服务。微服务和整体保持同步，并具有相同的数据，从一项服务或另一项服务读取产生的结果相同。

我们设法在2小时内将读取数据从JSON API传输到GraphQL数据源。

我们之所以能够如此快地完成它，主要原因是六角结构。我们没有让任何持久性细节泄漏到我们的业务逻辑中。我们创建了一个实现存储库接口的GraphQL数据源。我们只需要做简单的一行更改，即可开始从其他数据源读取数据。

到这时候，我们知道六角体系结构可以成功生效了。

单行更改的很大一部分在于，它可以减轻发布风险。如果下游微服务在初始部署时失败，则回滚非常容易。这也使我们能够分离部署和激活，因为我们可以决定通过配置使用哪个数据源。

隐藏数据源细节

该体系结构的一大优势是我们能够封装数据源实现细节。我们遇到了这样一种情况：我们需要一个尚不存在的API调用-服务具有一个API来获取单个资源，但没有实现批量获取。与提供API的团队进行交流后，我们意识到此端点需要一些时间才能交付。因此，我们决定在构建此端点的同时，提出另一种解决方案来解决该问题。

我们定义了一个存储库方法，该方法将在给定多个记录标识符的情况下获取多个资源-并且该方法在数据源上的初始实现向下游服务发送了多个并发调用。我们知道这是一个临时解决方案，数据源实现的第二个要点是在实现后使用批量API。

这样的设计使我们能够继续满足业务需求，而不会产生太多技术债务，也无需事后更改任何业务逻辑。

测试策略

当我们开始尝试六角架构时，我们知道我们需要提出一种测试策略。我们知道，要获得高速发展的先决条件就是拥有可靠且超快速的测试套件。我们不认为它是一件令人愉快的事，而是必须具备的。

我们决定要做三层都做好单元测试：

我们测试了交互器，其中业务逻辑的核心存在于其中，但与任何类型的持久性或传输无关。我们利用依赖注入并模拟任何类型的存储库交互。这是对我们的业务逻辑进行详细测试的地方，而这些正是我们努力进行的大部分测试。

我们测试数据源，以确定它们是否与其他服务正确集成，它们是否符合存储库接口，并检查它们在出现错误时的行为。我们尝试最小化这些测试的数量。

我们的集成规范遍及整个堆栈，从我们的Transport / API层到交互器，存储库，数据源以及重要的下游服务。这些规格测试了我们是否正确“布线”了一切。如果数据源是外部API，我们将命中该端点并记录响应（并将其存储在git中），从而使我们的测试套件可以在每次后续调用时快速运行。我们不会在这一层进行广泛的测试，通常每个域操作只有一个成功方案和一个失败方案。