1.用户行为数据:
反馈方式:显式&&隐式
表示:用户兴趣向量
数据预处理:大量样本存在噪声,可以去掉。
2.推荐方/算法
basic的三种:content-based、collaborative filtering(user-based & item_based)
算法优良应取决于实际的数据,不同的算法对不同的推荐系统反响不尽相同。
3.special的考虑因素
eg:时间戳(如、可以在计算相似度时引入时间因子)
地域特征
4. 冷启动问题:又可分为user冷启动 & item冷启动
user冷启动
solutions:1)热门推荐(排行榜)
2)充分利用其他信息,如用户的来源ip、访问时间、、、
3)初始用户回答问题(问题选择要有代表性、选项间要有区分度)
item冷启动:这时content-based方法能发挥关键作用,although此方法推荐进度不够高,但其在处理item冷启动时有先天优势。
5.推荐结果展示方式:
1)突出显示用户的关注重点:不同item的推荐,要考虑用户关注点不同;(一般包括标题、缩略图、介绍等)
2)推荐展示的场景和位置要符合用户的行为习惯(求职社交网站LinkedIn的对比实验表明,在用户 申请完一个工作的之前或之后分别展示推荐结果,前者的点击率是 后者的10倍。在网页正中 或 右侧边栏放置推荐结果,点击率也相差5倍之多。)
6.明确优化目标---then衡量指标
eg:点击率、准确率、覆盖率、多样性、新颖性、、、
可加权折衷后进行结果测评
反馈方式:显式&&隐式
表示:用户兴趣向量
数据预处理:大量样本存在噪声,可以去掉。
2.推荐方/算法
basic的三种:content-based、collaborative filtering(user-based & item_based)
算法优良应取决于实际的数据,不同的算法对不同的推荐系统反响不尽相同。
3.special的考虑因素
eg:时间戳(如、可以在计算相似度时引入时间因子)
地域特征
4. 冷启动问题:又可分为user冷启动 & item冷启动
user冷启动
solutions:1)热门推荐(排行榜)
2)充分利用其他信息,如用户的来源ip、访问时间、、、
3)初始用户回答问题(问题选择要有代表性、选项间要有区分度)
item冷启动:这时content-based方法能发挥关键作用,although此方法推荐进度不够高,但其在处理item冷启动时有先天优势。
5.推荐结果展示方式:
1)突出显示用户的关注重点:不同item的推荐,要考虑用户关注点不同;(一般包括标题、缩略图、介绍等)
2)推荐展示的场景和位置要符合用户的行为习惯(求职社交网站LinkedIn的对比实验表明,在用户 申请完一个工作的之前或之后分别展示推荐结果,前者的点击率是 后者的10倍。在网页正中 或 右侧边栏放置推荐结果,点击率也相差5倍之多。)
3)要提供推荐理由!!!!!(能够赢得用户的信任,进而让用户更容易接受推荐给他的结果)
4)设置一些按钮让用户对推荐结果进行反馈(参考amazon),不断改善用户体验。
6.明确优化目标---then衡量指标
eg:点击率、准确率、覆盖率、多样性、新颖性、、、
可加权折衷后进行结果测评