排序特征在线服务/模型在线推理

最新推荐文章于 2023-04-16 23:38:22 发布

带你去网吧里偷耳机

最新推荐文章于 2023-04-16 23:38:22 发布

阅读量248

点赞数

分类专栏：工作文章标签：搜索推荐

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40123329/article/details/121163760

版权

工作专栏收录该内容

2 篇文章 0 订阅

订阅专栏

排序特征在线服务

从持续产生的用户行为日志，可以处理得到用户画像、预测模型、实体属性等有价值的数据，这些数据都可以看作某个领域的特征（Features）。

数据处理业界已有成熟的框架，比如 MapReduce、Spark、Flink 等，可以满足不同场景的特征数据生成。但如何把特征应用于在线服务，则存在以下挑战：

特征存储的挑战。特征数据具有短时高吞吐写、在线读性能高、大批量事务写、版本回退等特点，已有的关系型数据、KV存储系统都无法很好的满足，在线服务使用特征数据的存储成本高昂；
特征检索的挑战。特征在业务侧的使用，很多时候都可以抽象为二分类、多分类或排序问题，后面两者在业务中占比很大（如推荐系统中的双塔模型召回和排序，图像检索，文章去重等），且都可以用ANN（Approximate Nearest Neighbor）搜索来统一解决。该问题在学术界已被长期研究，但仍缺少高性能、高可用、易扩展的工业化组件；
实时性的挑战。早期的特征数据大多是小时/天级别更新一次，但现在的系统会追求更高的实时性，如在线推荐系统。如何在保持组件的已有特性前提下，支持分钟/秒级的更新，是一个新的挑战；

带你去网吧里偷耳机

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
排序特征在线服务/模型在线推理

排序特征在线服务从持续产生的用户行为日志，可以处理得到用户画像、预测模型、实体属性等有价值的数据，这些数据都可以看作某个领域的特征（Features）。数据处理业界已有成熟的框架，比如 MapReduce、Spark、Flink 等，可以满足不同场景的特征数据生成。但如何把特征应用于在线服务，则存在以下挑战：特征存储的挑战。特征数据具有短时高吞吐写、在线读性能高、大批量事务写、版本回退等特点，已有的关系型数据、KV存储系统都无法很好的满足，在线服务使用特征数据的存储成本高昂；特征检索的挑战。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。