hadoop高校图书馆图书推荐系统

 高校图书馆图书推荐系统旨在根据用户阅读习惯为其推荐有针对性的个性化图书。协同过滤的主要特征是协同,它是对目标用户感兴趣内容进行搜集,然后再与他有相同兴趣的用户建立联系,并将这些用户感兴趣的内容推送给目标用户,这就是协同的真实体现。这种技术主要是对相同兴趣客户资源的一种类整合,将他们联系建立在一个群组当中,建立相应的管理表格,这样就可以进行个性化需求分享。根据图书检索的特点,我实现的图书推荐系统采用协同过滤技术作为个性化推理引擎的核心技术。使图书管理系统能够根据用户的不同,推荐出个性化和人性化的结果,使用户能够通过此系统,更加高效的检索和学习。图书管理系统跨越了时间和空间的障碍,使得任何时间、任何地点的用户都可以通过互联网来阅读。一般的推荐系统主要是由行为记录模块、模型分析模块和推荐算法模块组成。针对图书检索和书籍推荐,个性化图书推荐系统主要对图书馆日志里记录的读者借阅数据、查询数据等进行整理,分析挖掘读者的阅读爱好从而进行个性化图书推荐。个性化推荐技术的引入,使得原本呆板的图书管理系统有了生机,它可以针对不同的用户,推荐不同的图书资源,更适应用户的需求,使用户更加能够高效率的阅读。
三、主要研究内容
本课题对图书馆的书籍和用户数据进行采集,使用Hadoop技术进行数据整理并存储到MySQL数据库中;采用MapReduce技术进行数据分析,在结合图书馆书籍借阅的具体特征的基础上,提出适用于馆藏书籍的个性化推荐模型;对用户相关数据进行分析,为相似度较高的用户建立邻居关系,基于协同过滤算法产生符合用户兴趣的个性化图书资源列表;最后对推荐结果进行排序,并通过可视化技术展示出来。本课题主要分为以下六个模块:
1、书籍和用户数据获取
    对馆藏书籍和用户数据进行采集,再使用Hadoop技术进行数据整理,并将数据存储到MySQL数据库中,便于后续对数据进行分析。
2、数据清洗
    由于数据量较大,本课题采用MapReduce并行计算框架进行数据清理和数据整理。
3、馆藏书籍信息建模
    对已获取的馆藏书籍信息进行分析,构建符合其特征属性的基本模型,存储到MySQL数据库中。
4、用户建模及邻居关系分析
    根据用户借阅书籍的相关信息,采用每个读者的借阅评分向量来建立用户模型,通过余弦公式计算出各个用户之间的相似度,建立用户之间的邻居关系。
5、协同过滤
    图书管理系统基于关键词和图书分类号产生检索结果,本课题以读者的借阅记录作为个性化推荐的数据参考基础,将检索结果中已经借阅过的图书过滤掉,将过滤后的图书列表用于对用户的个性化推荐。
    本课题依据邻居的相似度及借阅历史,预测当前用户可能会喜欢的的书籍,根据邻居对图书列表中图书的偏爱程度进行第一次排序,再根据用户自己的向量模型计算得出按照一定顺序排列的最终书籍推荐列表。通过此策略为读者进行个性化的图书推荐:
(1)根据用户的借阅记录,过滤掉已经借阅过的图书;
(2)将邻居的属性向量数据和图书数据进行协同过滤,进行第一次排序;
(3)将过滤出的书籍与被推荐者进行协同过滤,进行第二次排序;
(4)将最终结果推荐给用户。
6、数据可视化
    使用浏览器对推荐结果及统计信息进行可视化,通过网页方式直观的展现出来。
 

  • 4
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

计算机专业码农一枚

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值