看完本文📖
你将:
- 清楚多来源的数据如果做到结构统一
- 对模板方法模式有更多的了解
- 对简单工厂(虽说不是设计模式中的一种,但是用的还是挺多的)能有更深的理解
- 知道设计模式之间的组合使用
前言
本文主要是记录和分享我在做ETL的业务时解决多种不同来源的数据进行结构化统一的问题。本文涉及了23种设计模式中的工厂模式和模板方法模式。
业务说明
在消息队列中,有各种不同平台的素材数据,但是每个平台的素材数据可能都稍有不同,我们需要将这些数据处理一下,最后输出统一的数据格式供下游进行计算处理;同时也要有良好的拓展性,以供我们后续拓展素材来源。
我画了下面这张图来帮助大家理解业务场景
数据抽取
首先数据抽取转换的结果是获得一个统一的数据结构的对象,而且是多种来源。所以我们可以使用工厂模式来进行解耦。这里我就使用简单工厂模式了,虽然它不是23种设计模式中的,但是用起来比较简单。
由于虽然是不同来源的数据,但是多多少少还是会有一些相同的属性的,我们可以将这些共同的属性统一进行设置,不同的属性再单独进行处理,这也符合我们的模板方法模式的应用场景。
具体类的设计如下:
准备工作
引入maven依赖:
<dependencies>
<dependency>
<groupId>org.projectlombok</groupId>
<artifactId>lombok</artifactId>
<version>1.18.22</version>
</dependency>
<dependency>
<groupId>com.alibaba</groupId>
<artifactId>fastjson</artifactId>
<version>1.2.78</version>
</dependency>
</dependencies>
本文主要用来讲解使用设计模式来解决实际业务,所以其他的依赖,诸如:
kafka
、flink
等都没有引入
功能实现
MediaEnum
package enums;
import lombok.Getter;
/**
* @description 素材枚举
*/
@Getter
public enum MediaEnum {
UNKNOWN("未知"