论文链接:http://keg.cs.tsinghua.edu.cn/jietang/publications/ACL20-Yu-Luo-et-al-MOOCCube.pdf
数据链接:http://moocdata.cn/data/MOOCCube
导读
MOOCCube是一个服务于MOOC相关研究的开源大规模数据仓库。和已有类似的教育资源数据库相比它的规模庞大,数据丰富且多样。其中的学生行为记录包括学习时长、学习次数、学习视频的区间等非常完善的学生行为。包含近20万名学生的、总计将近500万人次的视频观看学习的记录。这部分数据其实可以拿来做包括用户的行为分析建模甚至是相关推荐等等;对于课程视频资源,选取了706门课程和将近4万个视频并做以相应的数据处理;最后以知识概念为核心,将学生行为和课程的内容通过与知识建立联系、来完成实体之间的相互关联,构成MOOCCube。
1、MOOCs研究目的
-
对NLP和AI在在线教育中的应用研究
-
包含三个维度的MOOCs大型数据库(学生行为、课程、知识概念)
-
应用目标为帮助学生更好的掌握更多的知识同时帮助提升教学资源
-
建立以知识为核心的在线课程资源体系