【2017年第2期】基于校园一卡通数据好友发现及应用

鲁鸣鸣, 张丹, 王建新

中南大学信息科学与工程学院,湖南 长沙 410083

摘要:教育大数据是近年来的研究热点。利用分布式文件系统对校园一卡通数据进行存储、预处理和分布式计算。在此基础上,提出学生生活轨迹中的相遇模型,从而挖掘学生线下社交关系。为了区分熟悉的陌生人和真正的好友,从单个学生和整个班级两个角度分析学生线下相遇行为,既可以挖掘好友关系(包括比较孤立的学生),又可以为校园班级社群管理提供数据支撑。实验结果表明,挖掘出的社交关系比较符合实际情况。

关键词:社群发现 ; 相遇模型 ; 线下社交关系

中图分类号:TP181         文献标识码:A

doi:10.11959/j.issn.2096-0271.2017021


Smart-card based campus friend mining and its applications

LU Mingming, ZHANG Dan, WANG Jianxin

School of Information Science and Engineering, Central South University, Changsha 410083, China 

Abstract: Recently, educational big data has become a hot topic. A distributed file system to store, preprocess, and analyze campus card data was adopted. Based on it, a student encounter model has been proposed, so as to mine students’ offline social relations. To distinguish real friends from familiar strangers, the offline social relations for either individual students or classes were analyzed. Through these two perspectives, the students’ offline encounters was analyzed, which can not only extract social relationship between friends (including the isolated students), but also provide data support for the campus class management. The experimental results show that the mined social relations reflect the real relationship.

Key words: community discovery, encounter model, offline social relation


论文引用格式:鲁鸣鸣, 张丹, 王建新. 基于校园一卡通数据好友发现及应用[J]. 大数据, 2017, 3(2): 78-91.

LU M M, ZHANG D, WANG J X. Smart-card based campus friend mining and its applications[J]. Big Data Research, 2017, 3(2): 78-91.



1 引言

“数据驱动学校,分析变革教育”的大数据时代已经来临,利用教育大数据技术为教育教学决策提供有效的支持将成为未来教育的发展趋势。世界知名高校、机构和企业纷纷启动了教育大数据相关研究计划,从研究内容来看,国外教育大数据研究工作主要围绕学生信息系统和在线学习行为,综合运用统计学、机器学习和数据挖掘的技术,研究如何促进学习者学习的有效性,并根据学生能力和实际需求,提供个性化教育方案[1]。我国高校对在校生实行统一集中的住校食宿管理,这一特点使得我国的教育大数据不仅需要关注学习的有效性和个性化教育,还需要在心理健康和学生校园管理方面提供更好的指导。集中式的管理方式给我国的教育大数据发展带来了新的机会,提供了国外教育机构难以获取的学生线下行为数据。例如,不少高校都有校园一卡通系统,其数据能反映学生在食堂就餐、去图书馆、打热水、洗浴等生活轨迹信息。基于一卡通数据进行分析,国内已有不少研究成果[2-4]。

通过分析智慧校园数据来反映大学生学习生活状态,是帮助学校掌握学生动态一个有效途径。但是,很多研究工作是基于学生上网数据分析学生线上行为,线上数据不能准确反映学生的线下行为。虽然已有不少对学生线下行为分析的工作,但是绝大部分都只对线下行为数据进行统计分析,没有对学生线下社交关系进行挖掘。

笔者根据学生刷卡数据建立学生相遇模型,通过关联规则挖掘学生社交关系,并从学生角度、班集体角度两个方面反映学生线下社交情况。

笔者基于中南大学校园一卡通数据集,通过用户就餐刷卡数据记录,构建相遇模型,从而发现用户刷卡相遇,利用关联规则理论,计算相关度量(如支持度、可信度等),找出经常一起刷卡的学生,进而生成线下社交关系网络图、挖掘好友、发现社群。为验证相遇模型分析发现好友的准确度,对56名学生进行了访谈和问卷,发现好友准确度超过90%。

本文的主要贡献如下:

● 基于校园一卡通线下数据,定义相遇模型,挖掘学生线下社交关系;

● 将模型推广到一般场景,适用于一切具体相遇场景数据用户的好友挖掘;

● 挖掘出班级社交关系,找出“孤立”学生以及小团体活动的学生,及早发现潜在的孤独症学生,引导更健康的班级社群关系,为学校更好管理学生提供数据支撑。


2 相关工作

随着在线社交网络的蓬勃发展和线上用户的急剧增长,以交友、信息共享等为目的的社交网络迅速成长为人们传播信息、表述观点、发泄情绪的理想平台。很多研究者基于用户线上数据分析线上用户社交关系[5,6],但是线上社交分析没有办法很好地反映用户线下行为。

相关研究者对大学生心理健康的研究及调查表明[7-9],当代我国大学生心理健康形势比较严峻,相当一部分学生心理上存在各种不良反应和适应障碍,有的甚至到了较严重的程度,心理健康问题已经影响到大学生的健康成长与发展。因此,积极运用一切手段开展大学生心理问题的预防工作,是全社会的一项重要任务。但是大学生心理问题预防是一项长期的工程,需要对每个学生跟踪阶段性的状态,因此,挖掘学生线下社交,了解学生交友动态,引导和帮助学生积极健康学习、交友和生活是非常有意义的。

当前研究者对校园一卡通数据做了多方面的研究。罗华群[10]提出结合各单位的申请和一卡通系统的消费数据来审核助学金和贷款发放工作,比单纯由各院系收集学生们写的申请会更加合理和高效,也会更客观;陈建兵[11]利用一卡通系统数据辅助辨别贫困生;金培莉等人[12]提出从学校后勤、人事等部门以就餐人数、月均消费情况和洗浴情况3组数据分析来支撑学校决策等。研究人员基于校园一卡通数据及各类校园数据进行多方面分析挖掘,但是到目前为止,还没有研究者基于校园一卡通数据这类线下活动数据来分析学生社交关系。


3 整体思路

笔者的目标是通过校园一卡通数据挖掘学生好友以及学生社交状态,而好友总是倾向于一起活动,如一起去食堂就餐、去图书馆等,而这些线下行为在一卡通刷卡记录里得以反映,因此,可以通过分析一卡通刷卡记录的时空相关性发现学生之间一起活动的行为。同时,按照一起刷卡这个行为挖掘好友时,存在“熟悉的陌生人”这种情况,即有相似作息行为习惯却并非好友的陌生人,因此提出相遇模型解决这一问题。

利用校园一卡通刷卡数据进行相遇建模,计算学生刷卡相遇情况,然后以学生刷卡相遇数据计算相关支持度和可信度,从而发现关联规则,进一步分析学生之间的关联性,最后找出每个学生关联的学生,并将学生线下社交关系以社交网络图的形式呈现。为了更准确地计算相遇,对部分地点的刷卡机(POS机)聚类,使

  • 1
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值