强化学习输入的数据是序列数据
当强化学习应用到序列推荐时输入的是时序项目(按时间顺序排列)
当强化学习应用到其他推荐输入的是时序数据(可以理解为用户在选择推荐项目之前的一系列行为)
例如对话推荐中输入的是用户在选择推荐项目之前提及到的属性、项目
自己一点点理解,如有错误,欢迎指正
强化学习输入的数据是序列数据
当强化学习应用到序列推荐时输入的是时序项目(按时间顺序排列)
当强化学习应用到其他推荐输入的是时序数据(可以理解为用户在选择推荐项目之前的一系列行为)
例如对话推荐中输入的是用户在选择推荐项目之前提及到的属性、项目
自己一点点理解,如有错误,欢迎指正