本文目的是为了基于协同过滤实现个性化音乐推荐系统
初识推荐系统
主流的推荐算法
- 基于关联规则的推荐算法
- 基于协同过滤的推荐算法
- 基于内容的推荐算法
- 基于机器学习的推荐算法
推荐系统的项目结构
关键流程:
使用版本:
预备知识:
推荐系统的关键元素:
.推荐系统是一个系统工程:
由4部分组成:
算法: 重要地位
UI: 用户体验
数据: 最重要,公司资产(数据先行)
领域知识: 推荐系统所应用的业务场景
关键元素-数据
在推荐系统数据是十分重要的,俗话说的好“巧妇难为无米之炊”,没有数据就无法推荐。同时在企业中数据也是一个公司的重要财产,是私有的,保密的,同时数据需要清洗和预处理。
数据分为用户数据和物品数据,如下图,用户数据分为用户信息、用户行为、用户关系。其中,用户行为和用户关系在推荐系统中占主要地位。
用户行为数据:
用户行为数据能真实的反映每个用户的偏好和习惯,用户行为分为显示的用户行为以及隐式的用户行为,具体细节如下图:
购买:用户购买的歌曲或者歌单
收藏:用户收藏的歌曲
浏览:用户浏览的歌曲、评论。
关注:用户关注的歌曲或者歌单
停留时间:用户在一首歌上停留的时间,比如:立即下一首、单曲循环
跳转:用户通过什么方式进入本首歌曲,是别的用户分享推荐的链接还是广告引流的链接又或者自己在系统中点击进入的
点击:在听本首歌曲的时候点击了什么,调大声音、暂停、滑动歌词
用户关系数据:
用户与用户之间的关系:也同样有两种:
显式关系
隐式关系
隐式关系比显示关系更重要,更能显示出想要的效果。显示反馈数据比较稀疏,隐式反馈数据蕴含大量的信息。
关键元素-算法
- 基于流行度的推荐算法 根据PV UV进行推荐,无个性化推荐
- 基于协同过滤的推荐算法 重点
- 基于内容的推荐算法 #标签 #特征向量
- 基于模型的推荐算法 解决协同过滤算法的数据稀疏性问题
- 混合算法 多个推荐算法按照比重进行推荐。
关键元素-领域知识
不用领域,不同行业有自己的知识体系和评价标准,泛化的推荐无法满足具体领域中特定的用户需求,结合领域知识定制推荐系统
音乐系统在一定程度上就算一个社交领域。
关键元素:UI
- 推荐结果的最终呈现给用户的展示位置,提供了哪些信息
- 不同物品的推荐,根据用户的关注点,展现的方案也要不同。
一个好的ui可以提高推荐系统的转化率
推荐系统思维模式
- 要有不确定的思维----推荐算法都是概率算法
- 目标思维-------追求指标的增长。