- 博客(1)
- 收藏
- 关注
原创 基于MDP和Policy Gradient的强化排序学习(RLTR)实验
排序(rank)是搜索、推荐业务中经常能够遇到的业务场景:对于某个特定用户,如何针对该用户的信息,进行个性化的备选产品(candidate)的推荐排序,从而优化业务指标(例如点击率、营收等)?在大数据的支撑下,我们可以通过一些流行的机器学习算法来自动实现排序任务的学习,如基于传统模型计算出的分数直接排序,或者LTR(learning to rank)、rankBoost、rankSVM...
2018-03-16 23:02:07 3749 9
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人