【推荐系统】音乐推荐系统02

本文详细介绍了从网易音乐爬取数据并构建推荐系统的全过程。包括数据预处理、使用surprise和lightfm等库进行推荐算法的实现,以及解决冷启动问题和音乐基因分析。文章深入探讨了推荐系统在线和离线场景的应用,以及如何通过相似度计算和用户行为分析提升推荐效果。
摘要由CSDN通过智能技术生成

数据预处理

  1. 爬取网易音乐数据,格式为json。
  2. 数据:抽取歌单名称、歌单ID、收藏数、所属分类等歌单维度信息。歌曲ID、歌曲名、歌手、歌曲热度等歌曲维度信息。
  3. 做推荐系统常用的库:surprise、lightfm
  4. 推荐系统的项目有online和offline。offline可以使用Python,online追求的是效率key-value形式,可以使用C++或者Java。线上的一定要是最优的。
  5. 做推荐的时候并不是实时的推荐,而是已经把要推荐的东西做好了,想做就做。
  6. 有些东西随着时间的推移变化比较大,歌曲和歌曲之间的相似度。但是有些东西的变化不会那么大,人喜欢某种类型的歌曲。
  7. 将数据转换成想要的格式:user:item:rating:timesamp等。
  8. 歌ID到歌曲名的映射,歌单ID到歌单名的映射。
  9. 推荐算法:aprior、协同过滤、SVD、NMF等。
  10. 相似度计算:jaccard similarity。交集的个数/并集的个数
  11. 支持不同的评估标准:mse、msd、fcp等

实现步骤

  • 计算物品之间的相似度
  • 品类匹配word2vec。牛仔裤,上衣。
  • 冷启动问题
  • 音乐基因
  • 针对用户做预测。每个人喜欢的歌曲是有时效性的,将每个人的歌曲按照听的时间顺序进行排序
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值