完整资料进入【数字空间】查看——搜索"writebug"
摘 要
各种视频网站以及小视频的出现,自然的会产生大量的视频数据,产生的问题的是:用户怎么从这么多的视频数据里面选择自己喜欢的视频?我们用推荐系统来解决此问题。
本论文研究的是个性化视频推荐系统,主要是收集用户的爱好,以及 Web 的操作日志,例如用户的观看记录,观看后对视频的评分等信息。然后通过基于用户的协同过滤算法给用户推荐出符合用户的视频。
系统分为以下几个模块,用户模块:用户的相关操作,日志模块:收集用户在界面的操作日志,推荐模块:按照一定的算法给用户推荐视频,管理模块:对视频和用户的管理,例如添加新视频,修改视频相关操作,定时任务模块:计算推荐数据和执行相关的定时任务。各个模块通过共享数据库来衔接。系统前台使用 Bootstrap,jQuery,后台使用 Python 语言,Django Web 框架,采用 Oracle 数据库来开发。
关键词: 视频 协同过滤 模块 Django 推荐系统
一、绪论
1.1 研究背景和意义
如今我们生活在一个大数据的时代,智能时代。网络的应用使得资源的产生和分享很容易。互联网用户不断的在增加,这些用户每天会产生大量的博客、视频、图片以及与个人兴趣爱好相关的数据。我们从原来的信息缺乏进入到信息过载[1]时代。对于产生这些信息的人来说,怎么让自己的信息更快的传播,对于消费这些信息的人,怎么找到符合自己的信息都是极大的挑战。
在人们面对海量的数据无法筛选出自己有用的信息时,出现了搜索引擎[2],从以前的文字搜索转变为如今的语音搜索,这都给用户带来了很多的便利。但是,搜索引擎是建立在用户的需求已知情况下,并且搜索结果很多是相近的,需要用户通过自己的主观意识去判断,那个是自己需要的。如果用户的需求不明确,就是为了放松或娱乐,主要得符合自己的兴趣爱好,那么有什么好的办法吗?
推荐引擎[3]就可以弥补搜索查找的这种不足。它知道你的爱好,知道你喜欢什么,因此可以快速的推荐出与你兴趣爱好对应的信息,方便了用户的筛选,减少用户看到重复的信息和厌烦的广告甚至不健康的信息,增加了体验效果。
推荐引擎还可以处理的一个问题是信息过多。我们都生活在互联网时代,网络的应用与生活息息相关。去超市不用带现金,坐公交可以不带公交卡,吃饭可以不去饭店等等,这么多的应用因此会产生大量的数据。推荐引擎能从这么多的数据中筛选自己有用的信息。
过去的视频网站例如优酷,腾讯视频,爱奇艺,搜狐等,主要是根据视频的分类和搜索引擎来搭建,随着推荐系统的发展,逐渐的在原来的基础之上都添加了推荐功能。还有很热的小视频抖音,快手,火山等,用户随手一拍就可以产生一个。它们主要以推荐为主,抓住了用户的兴趣。
每个人所属的行业不同,因此关注的领域不一样,不论推荐系统是推荐什么,主要的问题是把用户关注的领域各方面都能推荐给用户,如果是以领域划分的推荐系统,那么应该把这一领域的历史,相关的资料文章,以及涉及到人物等等都可以推荐给用户。这样对信息的传播也是很有价值,当然这些在技术实现上也需要很大的研究和发展。如果我们是推荐物品,那么抓住用户的兴趣是非常重要,达到个性化的推荐,有些系统的推荐是针对所有的用户,与用户的兴趣爱好并不相符,进而不是个性化的。应该站在用户的角度多考虑问题,减少用户的输入,提高自动化推荐的功能。最后还要能建立在用户以前的会话基础上,这样才能达到个性化的推荐。