如何在vb.net中取得两时间的毫秒差_基于机器学习场景，如何搭建特征数据管理中台？...

最新推荐文章于 2024-02-29 19:58:16 发布

weixin_39635373

最新推荐文章于 2024-02-29 19:58:16 发布

阅读量159

点赞数

文章标签：如何在vb.net中取得两时间的毫秒差

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39635373/article/details/111378733

版权

本文介绍了在复杂机器学习场景下，如何构建高性能的特征管理中台。重点讨论了离线在线特征一致性的重要性，以及通过统一特征描述语言实现这一目标的方法。此外，文中还分享了中台的计算和存储核心组件，包括自研的全内存分布式时序数据库，以及在实际生产环境中的应用实践。

摘要由CSDN通过智能技术生成

「免费学习 60+ 节公开课：投票页面，点击讲师头像」

作者 | 陈迪豪，第四范式资深架构师

编辑 | Jane

出品 | AI科技大本营(ID：rgznai100)

本文为CSDN即将推出的《新战场：决胜中台》专刊的第 5 篇文章。

一、机器学习场景与高性能特征管理中台

理想的机器学习场景是给到数据，训练模型后就能直接上线服务。然而真实的 AI 应用落地过程非常复杂，并不是有数据、懂算法就可以了。

首先建模具有一定门槛，建模科学技术人才除了要懂机器学习算法，还要知道熟悉建模业务场景，会使用 SQL、Python 做数据处理、特征拼接、支持时序特征；建模完成到上线，要保持在线与离线一致性，实现高性能硬实时预估服务；工程上涉及特征监控、读写分离、实时特征计算，这些情况在真实的 AI 应用场景中都要考虑到。

以我们合作的某银行事中反欺诈场景下的性能要求为例：首先实时性要求 P99 响应时间在 20 毫秒以内，比大家在业务里统计的平均延时要小很多，只有 1% 的时间可以在 20 毫秒以上；二是建模特征非常复杂，在线和离线的模型特征超过1000个；三是窗口特征需要能够在实时场景中生成；四是模型迭代周期短，需要定期上线更新。

在这种情况下，对企业特征管理中台有什么要求？

1、存储和计算必须是高性能的；

2、对离线特征的支持要与在线保持一致性；

3、训练得到的模型要支持端到端的预估；

4、支持单行和时序特征；

5、预估服务支持分布式高可用。

其中为什么强调特征的离线在线一致性？

用开源软件一般可以做到的是，离线积累一部分数据，然后用开源的深度学习框架训练模型，模型上线时把模型加载进来，但是机器学习除了模型预估还包括前面的处理过程，每个离线特征要支持在线预估都需要花几倍时间进行维护，以确保离线数据到在线预估的特征数据是一致的。

我们如何保证离线在线一致性呢？

通过一个统一的特征描述语言，用户离线环境中用这种统一特征描述语言进行表示与建模，在线环境中直接使用这个建模脚本来上线。

最低0.47元/天解锁文章

weixin_39635373

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。