关于对KB4Rec数据集的学习

KB4Rec数据集是通过连接推荐系统数据集(如MovieLens, LFM-1b, Amazon book)和知识库(Freebase, YAGO)创建的,用于增强推荐系统的知识信息。它提供了结构化的知识,有助于提高推荐模型的性能。数据集在原论文中得到了验证,并被开源在GitHub上,但下载可能存在困难。" 48599229,1946683,红黑树详解:《算法导论》第13章总结,"['数据结构', '算法', '红黑树', '二叉树']
摘要由CSDN通过智能技术生成

1.数据集的组成

此数据集是将一些其他的数据集联系起来之后得到的一个数据集。
其他的数据集分为两类,分别是推荐系统的数据集和知识库。推荐系统的数据集(RS data sets),包括MovieLens, LFM-1b和Amazon book三种;知识库的数据集( KB data sets),包括Freebase和YAGO。

将来自推荐系统的三个数据集分别与来自知识库的两个数据集相联系,形成六个联系结果。
将以上数据集联系起来的主要思想是:根据RS data sets的项目标题与KB data sets相连接。(类似于数据库中的自然连接)
但最终在KB4Rec v1.0数据集中只提供了由推荐系统的数据集连接到Freebase的三个数据文件:ml2fb.txt、lfb2fb.txt、ab2fb.txt。

2.数据集的作用

由于推荐系统的三个数据集MovieLens, LFM-1b和Amazon book分别包含了电影、音乐、图书三大类,以及知识库的两个数据集Freebase和YAGO中包含大量的项目信息,所以KB4Rec包含丰富的知识库(KB)信息,可以为推荐系统提供丰富和结构化的知识库(KB)信息,使训练出的推荐模型具有更好的推荐效果。

在原论文(原论文地址)中,数据集的创建者对数据集KB4Rec进行了一系列的实验验证,如在KB4Rec的基础上比较不同的推荐算法,结果表明,KB4Rec是可行且有价值的。

另,笔者在毕业论文中采用了上文中提到的MovieLens数据集,在论文的总结与展望章节中,分析了采用的数据集具有一定的片面性。而KB4Rec数据集正好可以解决这个问题。

3.数据集的使用

数据集的创建者将KB4Rec发布在了GitHub上(数据集地址),可在GitHub中通过相应的代码调用数据集:

@article{
   Zhao-DI-2019,
   author = {
   Wayne Xin Zhao and
               Gaole He and
               Kunlin Yang and
               Hong{
   -}Jian Dou and
               Jin Huang and 
               Siqi Ouyang and
               Ji{
   -}Rong Wen},
   title = {
   KB4Rec: A Data Set for Linking Knowledge Bases with Recommender Systems
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值