特征训练、预测一致性管理工具：开源项目Feast

最新推荐文章于 2024-08-07 09:56:41 发布

Garvin Li

最新推荐文章于 2024-08-07 09:56:41 发布

阅读量2.2k

点赞数 1

分类专栏：机器学习文章标签：机器学习人工智能 Feast

本文链接：https://blog.csdn.net/buptgshengod/article/details/111051913

版权

机器学习专栏收录该内容

117 篇文章 19 订阅

订阅专栏

在机器学习的流程大体可以分成模型训练和模型服务两个阶段。无论是训练和服务阶段，其实都需要进行特征工程相关的工作，这块的技术挑战就是如何保证训练和预测过程中使用的特征是一致的。这个问题困扰了很多机器学习从业者，比较典型的场景就是推荐场景。在推荐业务中往往要用离线数据做特征工程然后输入到算法中训练生成推荐模型，在实际业务侧也需要按照同样的特征样本拼接方式生成预测样本，输入给模型做实时预测并拿到推荐结果。

今天要介绍的Feast其实是一个特征管理工具，他通过一套封装好的sdk保证了Model Serving和Model Training两个场景下的特征一致性问题。

Feast架构介绍

看下Feast的架构图，他可以接受Spark、Hive等数仓体系生成的Batch类数据，也可以将Log Service产出的数据通过Kafka构建成Streaming Feature与Batch数据结合构建特征。在Feast篮框内看到，针对Offline和Online的Feature提供了不同的方案，Offline Feature可以通过Feast SDK形成Training Features进行训练，在Online Feature可以通过部署Feast Serving构建出来用于Inference。而且训练和预测的特征是严格一致性保证的。接下来通过一个例子介绍下Feast是如何使用的。