摘要
大规模在线开放课程(mooc)正在成为一种时尚的教育方式,它为学生提供了大规模、开放的学习机会,以掌握知识。为吸引学生的兴趣,mooc提供商采用推荐系统向学生推荐课程。但是,由于一门课程通常由大量的视频讲座组成,每次视频讲座都涉及到一些特定的知识概念,直接推荐课程忽略了学生对某些特定知识概念的兴趣。为了填补这一空白,本文研究了知识概念推荐问题。我们提出了一种基于端到端图神经网络的注意异构图卷积深度知识推荐(ACKRec)方法,用于mooc课程中的知识概念推荐。与其他推荐问题一样,它也存在稀疏性问题。为了解决这个问题,我们利用内容信息和上下文信息,通过图卷积网络来学习实体的表示。除了学生和知识概念,我们考虑其他类型的实体(如课程、视频、教师),并构建一个异构信息网络(HIN),以捕捉不同类型实体之间相应的富有成效的语义关系,并将它们纳入表征学习过程。具体来说,我们在HIN上使用元路径来引导学生偏好的传播。在这些元路径的帮助下,学生对候选知识概念的偏好分布可以被捕获。此外,我们还提出了一种注意机制来自适应融合来自不同元路径的上下文信息,以捕获不同学生的不同兴趣。为了了解所提出模型的参数,我们建议利用扩展矩阵分解(MF)。进行了一系列实验,与最先进的基线方法相比,证明了ACKRec在多个流行指标上的有效性。结果表明,所提出的ACKRec能够有效地向慕课在线学习的学生推荐知识概念。
1 引言
近年来,大规模在线开放课程(massive open online courses, MOOCs)逐渐成为全球范围内的一种另类教育模式。例如,Coursera、edX和Udacity这三个领先的MOOC平台为数百万用户提供了来自国际知名大学的众多课程。在中国,数以百万计的用户在“学堂x1”学习,它是最大的MOOC平台之一[20],提供各种科目的数千门课程。虽然mooc的学生人数在不断增长,但mooc仍存在一些困难。mooc的整体课程完成率低于5%[34],如何吸引学生在平台上持续高效地学习是一个具有挑战性的问题。因此,它需要更好地理解和捕捉学生的兴趣。
为了了解和捕捉学生在mooc平台上的兴趣,我们做了很多努力,包括课程推荐[13,35],行为预测[20],用户意图理解[34]等。其中,mooc提供商采用推荐系统向学生推荐课程。然而,一门课程通常由大量的视频讲座组成,每个视频都涵盖了一些特定的知识概念。直接的课程推荐忽略了学生对特定知识概念的兴趣,例如不同的老师讲授的计算机视觉课程在微观上可能有很大的不同(涵盖不同的知识概念集合):有的老师可能只涉及基于几何的方法,而有的老师可能只涉及基于深度学习的方法,因此,向对基于深度学习的方法感兴趣的学生推荐只涉及基于几何的方法的计算机视觉课程并不是一个很好的匹配。因此,需要从微观角度研究学生的网络学习兴趣,并进行知识概念推荐
传统的推荐策略,如协同过滤(CF),它考虑用户(学生)的历史互动,并基于具有相似兴趣的用户的潜在共同偏好进行推荐,取得了巨大的成功。然而,基于CF的方法存在用户-项目(学生-知识概念)关系的稀疏性,限制了推荐性能。为了克服这个问题,我们做了很多努力,利用了一些边信息,比如社交网络[11]、用户/条目属性[27]、图像[33]、上下文[25]等。在mooc平台中,我们观察到除了用户和知识概念之外,还存在多种类型的实体(视频、课程、教师)以及不同实体之间的多种关系。表1为2018年1月1日至2018年3月31日实测的“学唐x”真实数据统计情况。这个数据包括9986个用户,43405个视频,7020个课程,5038个教师,1029个知识概念,以及对应的多种关系类型。如图1所示,“课程:V_9e77179”中包含“知识概念:c++”,“学生:207256”中包含“课程:CaltechX”,“视频:V_1a9aa686”中包含“知识概念:二叉树”,“课程:CaltechX”中包含“老师:Smith”。此外,考虑到用户的行为历史,我们可以发现额外的关系。例如,“用户:207256”点击了“知识概念:c++”、“知识概念:二叉树”、“知识概念:深度优先搜索”。考虑到以上多种类型的关系,我们可以得到用户和知识概念之间更富有成效的事实和交互。如果仅从基本结构上看,我们很难发现“知识概念:深度优先搜索”和“知识概念:时间复杂度”这两个属于不同课程但被一个用户点击的显著交互关系。如图1所示,不同的知识概念包含不同的上下文。仅利用单一的交互类型可能会忽视用户与知识概念之间的重要关系。例如,“知识概念:c++”和“知识概念:二叉树”虽然包含在同一个视频中,但语义不同。这些异构关系提供了丰富的侧信息,对推荐系统有三个方面的好处:(**1)引入知识概念之间的语义关联,有助于识别潜在的交互;(2)合理扩展用户兴趣,增加推荐知识概念的多样性;(3)可以通过沿着这些关系跟踪用户的历史记录来解释用户的兴趣。**因此,它需要将这些异类关系纳入实体的表示学习中。
基于上述观察,我们提出了一种面向mooc平台的端到端知识概念推荐框架——注意异构图卷积深度知识推荐器(attention Heterogeneous Graph Convolutional Deep Knowledge Recommender, ACKRec)。为了捕捉异构复杂关系,我们将mooc平台数据建模为一个异构信息网络(HIN)[23]。然后,我们提出了一种基于注意的图卷积网络(GCNs)来学习不同实体的表示。传统的GCNs只能捕捉同构实体之间的同构关系,而忽略了异构关系之间的丰富信息。为了解决这个问题,我们使用元路径[25]作为指导,通过GCN在HIN中捕获异构上下文信息。这样,异质关系的利用就更加自然和直观。此外,考虑到不同的学生可能有不同的兴趣,我们进一步提出了一种注意机制,以适应环境在多个元路径。最后,通过扩展矩阵分解对模型参数进行优化,得到最终的推荐列表。
本文贡献:
- 我们发现了现有mooc推荐系统经常忽略的知识概念推荐的重要问题。知识概念推荐填补了这一空白,提供了更微观层面的推荐。
- 我们提出了一种新颖的端到端框架ACKRec,利用丰富的异构上下文侧信息来辅助知识概念推荐。
- 我们开发了一个异构信息网络模型,以捕捉mooc平台中不同类型实体之间的各种复杂交互。
- 我们设计了一个基于注意力的图卷积网络,它可以将内容和异构上下文一起纳入不同实体的表示学习中。该模型在元路径的引导下,通过注意的方式传播用户偏好,自动发现用户潜在兴趣。
- 我们使用从XuetangX收集的真实数据进行了大量的实验研究,以充分评估拟议模型的性能。我们研究了参数,包括元路径组合、表示维度、潜在工厂数量和GCNs层数。与一系列强基线相比,我们综合证明了所提出的模型的有效性。