参考网址:
特征平台(Feature Store):序论 - 知乎
特征平台(Feature Store):Feast - 知乎
背景
AI 算法模型开发落地可以分为三个阶段:数据准备、模型训练、模型部署。市面上已经有较多通用平台支撑模型训练与部署阶段,但自2019年后才陆续有各厂商推出特征平台支撑数据准备阶段。比如 Feast (以下内容主要以Feast为例讲解)
特征平台的能力
各家的特征平台的具体实现不同,但一般以下几个功能:
- 特征创建
- 特征注册中心
- 特征离线存储&消费
- 特征在线存储&消费
特征创建
从各类原始数据,例如日志、记录、表,经过关联、统计、转化、聚集等操作得到的一系列值。
例如,对于电商领域,从用户行为日志,可以计算得到用户最近30天购买商品列表、最近1小时浏览商品列表、平均订单金额等特征。
特征是特征平台上最基础的概念。
(to do)
与Kubeflow的结合
Kubeflow主要可以通过 Feast 暴露的API 对特征平台进行访问调用。详见:Getting started with Feast | Kubeflow