基于矩阵的用户网络关系计算机,基于用户网络社交信息的推荐算法研究与实现-计算机应用技术专业论文.docx...

武汉理

武汉理工大学硕士学位论文

万方数据

万方数据

摘要

随着互联网和信息技术的飞跃发展,作为信息过滤的一项重要解决方案, 个性化推荐技术得到了广泛的研究与应用,各大互联网网站纷纷提供了个性化 推荐服务以提高网站的核心竞争力。尽管协同过滤推荐算法在推荐系统中广泛 应用并且获得了巨大的成功,但随着互联网的发展,网络资源信息越来越庞大, 网络用户人数越来越多,协同过滤的发展也面临着巨大挑战,比如数据稀疏、 冷启动等问题。近几年,随着以 FaceBook、微博、微信为代表的社交媒体的流 行,给个性化推荐研究提供了新的思路,通过分析和挖掘用户在社交网络中的 海量信息和行为以及社交关系,可以知道用户的兴趣爱好,进而为用户提供更 加准确的个性化服务。为缓解数据稀疏造成的推荐质量低的问题,本文将用户 社交网络关系融入了协同过滤推荐算法中,来提高推荐的准确度。本文的具体 研究工作如下:

(1)重点研究了协同过滤算法,分析了协同过滤技术目前存在的问题,针 对数据稀疏性问题,提出了一种组合推荐算法。算法的思想是将 Slope One 算 法和基于用户的协同过滤算法技术通过叠加的方式结合起来,利用 Slope One 简单、高效、准确度高的优点来对评分矩阵进行填充,缓解数据稀疏性问题, 最后给出了算法的具体实现过程。

(2)分析了目前比较经典的几种相似度算法的原理与缺点。针对不足之处, 分析了社交网络信息对推荐的意义,然后综合利用用户的个人偏好信息和社交 网络关系特征做出推荐。通过将用户个人偏好信息计算的用户相似度和利用社 交网络关系计算的用户相似度进行线性加权融合,不仅可以提高推荐质量,也 可以增加推荐系统的可信度。为进一步提升准确度,利用基于共同评分项数目 的因子对融合后的相似度模型进行修正,基于此相似度模型给出了融合社交信 息的协同过滤推荐算法的推荐过程。

(3)在 Mahout 上进行了算法的实现。并利用 Movielens 数据集和百度推 荐大赛数据集进行实验分析与验证,并与传统的协同过滤算法进行对比,验证 改进方案的可行性。

关键字:推荐系统,协同过滤,用户偏好,社交网络关系,Mahout

I

Abstract

With the rapid development of the Internet and information technology, personalized recommendation technology has been widely studied and applied as an important information filtering solutions, and the major Internet sites have provided personalized recommendation service to enhance the core competitiveness of the site. Although collaborative filtering algorithm has been widely used in recommender systems and get a great success, the network resource information and the number of users get a dramatic increase with the development of the internet, which makes collaborative filtering development face enormous challenges, such as data sparsity and cold start problem. In recent years, the popularity of social media represented by FaceBook, micro-blog, WeChat provides a new idea for personalized recommendation research. By analyzing and mining user’s mass of information and behavior and social relationship in the social networks, we can know his interests, then provide more accurate personalized service for him. In order to alleviate the problem that data sparseness le

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值