大数据毕业设计之Python+Vue.js知识图谱音乐推荐系统

互联网在如今的爆发式发展已经改变了我们的生活方式,互联网上资源的爆发式增长让获取有效信息成为了新的难题。用户接触到的信息非常有限。于是很多提出帮助用户快速精准找到所需信息的解决方案诞生了,例如搜索引擎,推荐系统等。

国内研究现状:国内的音乐推荐技术发展相对缓慢。大多数音乐网站采用的技术不够成熟,基本上是针对所有用户,大数据成分太少。不过,经过一段时间的发展,国内也涌现出了一些优秀的音乐推荐网站,比如 SongTaste、虾米网和豆瓣网等。SongTaste 是一个社交性质的音乐网站。在它的社区中,每一个用户都可以看到大家最近在收听什么音乐、有什么新的音乐推荐。它的音乐分类相当齐全,而且推荐排行实时更新。另外,根据用户平时推荐的音乐、听歌行为以及音乐收录信息,还能够找到“相似的品味者”,从而更好地做出推荐。豆瓣网也是一个社交性的音乐推荐网站。它主要通过豆瓣小组、新浪微博、MSN、开心网、人人网等互动平台来分享和传播用户喜欢的音乐。虾米网在注册成为网站会员时会让用户选择至少5位艺人进行收藏,以此来初步确定用户欣赏音乐的倾向。另外,用户还可以从大家的推荐中搜索自己喜爱的音乐,或者从品味相似的好友中找到适合自己的音乐。

国外研究现状:大数据推荐系统的定义是 Resnick 和 Varian 在 1997 年给出的:“它是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程”。从最初在电子商务网站的深度剖析,到当下在的音乐、电影、学习资料等不同领域的广泛应用。在三十多年的时间里,大数据推荐系统一直是学术界和工业界的关注的焦点。其优点在于主动性。它能自发地收集并分析用户的行为数据,为用户的兴趣建模,得到用户的兴趣偏好后,匹配系统中资源的特征,为用户做出有效的大数据推荐。同时,推荐引擎要一直监测系统中的项目变化和用户在不同行为下的兴趣特征变迁,针对不同的变动,做出相应推荐策略的调整。各平台为增加用户的黏着性,以及用户对推荐结果的准确度要求,使得推荐系统的核心技术层出不穷,比较成熟的推荐技术有:基于内容的推荐、协同过滤(基于相似度的最邻近协同过滤算法、基于潜在因子的矩阵分解推荐算法)、深度学习、基于标签的推荐系统、混合推荐算法等。

总结:目前大型的音乐门户类网站的歌曲库规模往往包含上千万首的歌曲,这些歌曲被划分成不同的语种、流派、年代、主题、心情、场景等,包含的信息非常的丰富,存在着严重的信息过载。对于系统中每一位音乐用户来说,都不可能去收听曲库内的每一首歌, 很多时候用户的需求往往是“一首或几首好听的歌曲”这种模糊的需求,如何根据用户在系统中产生的行为信息去庞大的歌曲库中挖掘出用户可能感兴趣的音乐,这就需要个性化音乐推荐系统综合考虑用户偏好、时间、地点、环境等各种复杂的特征,准确的从上千万的海量歌曲库中挑选出此时此刻最适合这个用户聆听的个性化音乐,给广大的用户带来美的享受,真正做到众口可调。

2.研究(设计)的基本内容、目标、拟采用的技术方案及措施

基本内容

论文主要研究的是基于协同过滤算法(基于用户、基于物品两种形式)而开发的音乐可视化推荐系统。设计思路是用户通过登陆进入系统,根据用户的历史收藏、浏览等埋点日志数据,以此来初步确定用户欣赏音乐的倾向。另外,用户还可以从大家的推荐中搜索自己喜爱的音乐,或者从个性化推荐音乐列表中找到适合自己的音乐。除此之外,系统可以实现直观的可视化统计图表,如:歌手数量、歌曲数量、歌词数、评论数、歌手歌曲分析、歌手专辑分析、歌手平均热度排名、专辑平均热度排名、歌曲发行情况、版权情况分析、翻唱情况分析、热门歌手作品发行情况、词云分析、歌曲热度分析等。支持对歌曲评论的情感分析。具体内容如下:

使用requests等Python爬虫技术爬取网易云音乐歌曲信息、评论信息、歌词等数据;
基于协同过滤算法完成用户个性化音乐推荐;
使用lstm完成词云分析、情感倾向分析;
使用echarts、pandas、numpy对音乐数据进行分析与可视化,直观展现给用户;
目标

平台的搭建。在课题开始之前需要安装开发环境,其中框架需要配置正确的参数和安装环境,这里的参数配置是相对困难的。
系统里的数据从网易云中获取,存放到自己的数据库中,网易云网页版爬取时有反扒机制,并不容易获取。
推荐算法的实现。系统选择使用协同过滤算法。算法的正确实现是推荐页面实时更新的关键。算法实现不仅要求数据格式正确还要求算法代码的正确编写。
推荐页面实时更新。前端页面能够运行起来是很容易的,在后端数据推荐算法的实现后,前端的信息能够及时变化是非常必要的。在系统开发完成之后,一位用户获取一次推荐是比较容易的,多位用户获取多次推荐,且要得到及时反映是比较困难的。
拟采用的技术方案及措施

前端开发:vue.js、echarts

后端开发:flask

数据库:mysql

机器学习/算法:协同过滤算法(基于用户、基于物品)全部实现

爬虫:requests

知识图谱音乐推荐算法是一个复杂的系统,涉及到数据的获取、处理、建模和推荐等多个环节。下面是一个简化的示例代码,演示如何使用知识图谱中的音乐相关数据进行基于用户兴趣的音乐推荐:

  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值