亚马逊推荐系统20年

最新推荐文章于 2023-05-19 22:36:17 发布

江州月

最新推荐文章于 2023-05-19 22:36:17 发布

阅读量3k

点赞数 1

分类专栏：数据科学家文章标签：推荐系统亚马逊

数据科学家专栏收录该内容

2 篇文章 0 订阅

订阅专栏

摘自极客头条《一文了解Amazon推荐系统20年变迁》
原文链接一文了解Amazon推荐系统20年变迁
英文原文Two Decades of Recommender Systems at Amazon.com

亚马逊推荐系统20年

关键词：协同过滤推荐系统个性化

理念

为每个人打造专属商店

起始

1998年基于物品的协同过滤推荐系统
优点：简单易于理解可扩展性强高效基于线下数据快速更新可解释性强
挑战：
实时可扩展性能推荐质量

UserCF
适用于用户数的变化频率小于物品数的变化频率，ItemCF则相反

影响推荐质量的关键因素：相关度
推荐系统是对统计数据的应用,从随机性中发现规律

一个购买了1000件商品的用户总要比购买了20件商品的用户的被选中几率高50倍。所以从购买记录中随机采样得到的结果在用户维度上并不是均匀分布的，也就是说我们得到的是有偏的样本。对于任意物品X，购买了X的用户要比整体用户购买量更多
用户购买历史的非均匀分布,意味着在计算有多少购买了X的用户会随机购买Y时不能忽略是谁买了X

用户浏览与购买物品不同
低价物品：浏览并购买类似物品
高价值物品：浏览与购买差别较大

自我发现的数据模式优于人工

时间的重要性

邻近：买A之后5个月买B 关联度<买A的同时买B
方向性：买A之后买B 概率>买B之后买A
顺序性/连续性：在一段较短时间内连续购买一系列商品
季节性流行

冷启动问题：
新商品缺少足够的数据，计算相关性时处于劣势

新闻/社交信息推送：融合基于内容的算法（使用题目，主题和文本等）和基于行为的算法（使用购买，浏览和打分等）

购买内容的利用：
一本书提供的用户兴趣信息远比一双袜子（非出版物）多
因此，需要识别哪些购买能提供有用的推荐而哪些应该被忽略

多样性：为一位深度阅读爱好者推荐书籍之外的其他商品
意图的明确性：用户的购买意图很明确时，收窄推荐内容范围；当意图并不明确或确定时，探索性和新奇性应该是推荐的目标–>长期优化

推荐的未来

探索过程应该像和一位朋友聊天一样，这位朋友了解你，知道你的爱好，陪伴你的每一步，知道你的需求
未来的推荐系统将继续构建在计算机算法的基础上

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。