使用协同过滤算法来实现内容推荐,程序开发选用Apache Mahout来进行具体实现
Mahout是一个开源的分布式机器学习算法的算法库,它是一个基于java实现的可扩展的,高效的推荐引擎
Mahout常用推荐算法:基于用户的推荐,基于内容的推荐
推荐算法步骤
1.收集用户偏好数据,用户的偏好数据可以体现在多种操作行为上,如点赞,收藏,转发,是否购买等
2.数据降噪和归一化处理:不同偏好维度的数据需要进行数据降噪和归一化处理来形成统一的偏好得分
3.算出相似的物品或者用户:基于用户的推荐,基于内容的推荐
基于用户的推荐
核心思想:推荐和此用户相似的用户喜欢的内容
本质是基于用户对内容的偏好找到相邻的相似的用户,然后将邻居用户喜欢的内容推荐给当前用户
基于内容的推荐
核心思想:推荐和此用户喜欢内容的相似内容给当前用户
本质是基于用户对内容的偏好找到相似的内容,然后依据用户的历史行为偏好,推荐相似的内容给用户