高三学生发表AI论文,提出针对网络暴力问题的新模型AdaGCN

作者 | 神经小兮

来源 | HyperAI超神经(ID:HyperAI)

【导读】近日,在清华大学举行的丘成桐中学科学奖半决赛落下帷幕,来自海内外的 72 支队伍获得了总决赛的入场券,北京师范大学附属实验中学的高三学生白行健,也在其中。他凭借一篇利用图卷积神经网络检测网络暴力的论文,在比赛中脱颖而出。长江后浪推前浪,瞧,00 后也要出道了。
高三的时候,在做什么呢?刷《五年高考三年模拟》?还是背英语单词?
一名叫做白行健的北京师范大学附属实验中学高三学生,已经在研究神经网络了,而且带着最新论文,入围丘成桐中学科学奖决赛。
 
用卷积神经网络,检测网络暴力

白行健目前是北京师范大学附属实验中学(简称北师大实验)国际部高三学生,热爱数学和计算机科学,担任学校计算机社社长和⼈⽂社社长。
他本次参赛的论文标题为《基于自适应性图卷积神经网络的暴力用户检测》,论⽂提出了⼀种新的⾃适应图卷积神经⽹络模型(Adaptive Graph Convolutional Neural Networks,简称AdaGCN),是在传统的 GCN 模型的基础上做了改进和创新。

在新模型中,边权被设置为可训练的变量,这允许模型⾃适应性地学习⽤户之间关系的权重。⼀个值得关注的问题是,虽然可训练的边权提升了模型的能⼒,但是参数的增加会导致模型更难训练并可能发⽣过拟合。
为了解决这个问题,本⽂引⼊标签平滑假设(Label Smoothness Assumption),即在社交⽹络上相邻的两个⽤户更有可能会有相同的标签(即他们更有可能同时为暴⼒⽤户或同时为正常⽤户)。本⽂使⽤标签平滑假设对边权的训练施加了额外的监督。

具体来说,本⽂引⼊标签传播算法(Label Propagation Algorithm ,简称 LPA),并设计了丢⼀损失(the leave-one-out loss)作为标签平滑假设的具体实现,从⽽实现了和 GCN 模型的⾃然结合。

LPA 与丢一损失结合(左)
AdaGCN 的传播方案,其中特征向量和标签同时传播(右)
本⽂在 Manoel Horta Ribeiro 等⼈收集的数据集上应⽤了 AdaGCN 模型。该数据集包含了 10 万余名 Twitter ⽤户和 200 余万条社交关系,其中⼤约 5 千名⽤户被标注了是否为暴⼒⽤户。
实验结果表明,AdaGCN 的 AUC 得分为 0.80,F1 得分为 0.47,得分⾼于所有对⽐⽅法,包括传统的 GCN 模型、图注意⼒⽹络 (GAT)、标签传播算法(LPA)、⽀持向量机(SVM)等等。此外,AdaGCN 模型的结果具有最低的标准差,这表明 AdaGCN 模型具有很强的稳定性。
在训练集上 LOSS、AUC 和 FI (从左至右)得分
论文中指出,在线社交平台可以利⽤本⽂提出的⽅法来更好地评估、检测暴⼒⽤户,防⽌暴⼒⽤户伤害他⼈并传播仇恨⾔论。 同时,⾃适应图卷积神经⽹络模型,也可以⽤来评估不同类型的暴⼒⾔论造成的社会影响。
 
有技术,有情怀

网络暴力的确已经是这个时代的一种新的暴力形式,它可能无形中带给当事人巨大的伤害,甚至最终酿成严重后果。
在本次比赛中,白行健选择用技术检测网络暴力问题,因为身处互联网时代的他,也亲眼看到过身边的朋友遭遇网络暴力,而他选择用技术来帮助受害者。

前段时间,韩国女星崔雪莉的死亡
引发了一场「拒绝网络暴力」的讨论
白行健在论文中解释道,「2018 年 2 ⽉ 10 ⽇,⼀个名叫 Ted Senior 的 22 岁男孩在林地上吊⾃杀,原因是⼀些⼈在社交媒体上恶意地分享和评判他与⼀名⼥孩的聊天内容。

在我身边,我的同学好友在学校论坛发表观点,但是遭受匿名的辱骂和攻击,这种羞辱让他感到⾮常痛苦。我深深地被这些可恨的⾏为和可怕的后果所触动。计算机科学带来了信息时代,社交⽹络改变了我们的⽣活,我们期望技术会让世界更美好。但没有什么是尽善尽美的。⽹络暴⼒是信息技术⽆意中带来的⼀个问题,我渴望找到⼀种⽅法来发现和控制它们。」

白行健还是学校 Bridge 爱心社成员
课余时间为小朋友讲解计算机知识
白行健还表示:「技术旨在为⼈类带来便利和幸福,我们希望⽤技术的⽅法缓解网络暴力问题,给所有⽤户提供⼀个⼲净、友好的互联⽹世界。」
 
典型的学霸履历

看过白行健的履历,用「优中选优」来概括一点也不过分。
他所就读的北师大实验中学,创建于 1917 年,是北京首批重点中学。近几年,其文理科一本率上线率均为 100%。学校师资队伍中,有博士 3 人,硕士 90 余人。
而他所在的北师大实验的国际部,更是被家长称为「全国最牛国际班」。

有知乎网友评论其「在大陆高中一骑绝尘」
2018 年北师大试验 UCLA 录取人数位居全国第一

2018 年,北师大实验国际部的学生,86% 进入美国 TOP 30 的名校就读。这里的学生,不少在初一、初二就开始准备托福,初三、高一准备 SAT。

白行健不仅在这次丘成桐中学科学奖中表现优异,在此前,他一直穿梭于各种比赛之中,并取得拔尖的成绩,金牌、第一名等字眼,布满他的履历:
白行健 (2017年-2019年部分殊荣)

•2018 年 5 ⽉受邀参加加拿⼤信息学奥林匹克竞赛(CCO)决赛及国家队集训营,获得决赛⾦奖第⼀名;
•2018 年 7 ⽉获得中国信息学奥林匹克竞赛决赛(NOI)银牌;
•2018 年 11 ⽉获得中国信息学联赛(NOIP)北京市提⾼组⼀等奖第 3 名;
•2019 年 1 ⽉参加美国信息学奥林匹克竞赛(USACO)公开赛获得满分,5 ⽉作为唯⼀的外国学⽣受邀参加美国国家队集训营(USACO 前25名美国中学⽣参加,选拔国家队成员);
•2018 年获得美国⾼中⽣数学建模竞赛(HiMCM)Finalist 奖项(⼀等奖 7%);
•2018 年获得美国数学⼤联盟杯(Math League)中国赛区第⼀名;
•2018 年获得美国数学竞赛(AMC) Distinction Honor Roll(荣誉奖 1%),AIME获得 8 分;
•2017、2018 连续两年获得北京师范⼤学附属实验中学⾦帆奖(top 2%)。
而他这次入围丘成桐奖总决赛,也是从来自国外 1500 多个团队中脱颖而出(共 72 支队伍入围),从此,他的人生履历中又新添一条出色的记录。

2019 年 5 月,白行健(右一)与其他三名同学代表北京
参加全国信息学奥林匹克竞赛(CCF NOI)
 
关于丘成桐中学科学奖

白行健这次所参加的丘成桐科学奖比赛是什么来历呢?

Dongrun-Yau Science Awards 东润丘成桐科学奖(原名「丘成桐中学科学奖」)是由中国著名数学大师丘成桐先生于 2008 年为全球华人中学生设立。每年累计有 1200 余所学校,约 5800 余支队伍参与此场科学界的盛宴。

本届丘成桐将涵盖了数学、物理、化学、生物、
计算机及经济金融建模六个学科
参赛队员覆盖国内外多个地区。每组参赛队前期要经过至少三轮的论文评审,通过后才有资格进去决赛。进入决赛的同学,需要经过来自国际顶尖高校包括美、英、法等国在内的 20 多位世界一流的教授组成的评审团的评定,并进行英文答辩。

白行健所参加的本届比赛,共有来自国内外 500 余所中学 1500 余团队、近 2000 名学生报名参赛,经过初筛、函评、桌评等程序,最终 72 支队伍入围。
看来,这个大赛的含金量也着实不小。前段时间, 我们曾在 10 月采访了三位 95 后,刚进入职场发光发热的他们已经在计算机领域走出自己的一片天地。

而现在 00 后已经加入 AI 大军,还没上大学,就已经带着论文过关斩将,光速奔走在改变世界的道路上。

(*本文为AI科技大本营转载文章,转载联系原作者


精彩推荐



开幕倒计时11天|2019 中国大数据技术大会(BDTC)即将震撼来袭!豪华主席阵容及百位技术专家齐聚,十余场精选专题技术和行业论坛,超强干货+技术剖析+行业实践立体解读。6.6 折票限时特惠(立减1400元),学生票仅 599 元!


推荐阅读


  • 你点的每个“在看”,我都认真当成了AI

随着“平安城市”建设的不断推进,公共安全逐渐成为人们关注的热点间 题,税频监控技术也随之得到了越来越广泛的应用,传统的视频监控系统主要提供采集存储功能,这远远无法满足人们对其智能化的需求。要实现智能化的视频监控系统,以下几个关键问题亟需解决:(1)如何快速发现监控视频中的异常行为,及时给出警报,并最大限度地减少误报和漏报现象;(2)如何在多种不利因素下(如羊样本,低分辨率)对可疑目标进行准确的识别分析:(3)在海量数据的情况下,如何确保视频分析系统的实时性及准确性。 近年来,深度学习在机器视觉、语音识别和自然语言处理等多个领域都取得了优异的成绩,这也为智能视频分析技术的发展带来了的契机。因此,本文基于深度学习的方法对上述相关问题展开研究,主要研究工作与创如下: 1,针对监控视频中的异常行为尤其是暴力打斗行为难以准确快速发现的问题提出了一种基于三维卷积深度网络暴力检测方法。该方法利用大量带标签的视频数握进行有监督的学习,通过将传统二维卷积核扩展为三维来提取视颈中的运动信息,然后综合利用视频的空间信息及运动信息来构建深度神经网络模型,从而实现对监控视须中暴力打斗的检测。由于深层模型端到端学习的特性,所以不需要设计复杂的手工特征来描述运动信息,从而降低了任务的复杂度。实验结果表明,本文提出的方法在单一场景以及人群密集环境下都可以对暴力打斗行为进行准确识别。 2.针对人脸图像在单训练样本下难以被准确识别的问题提出了一种基于核主成分分析网络(Kernel Principle Component Analysis Setworks,KPCANet)模型的二阶段投票人脸识别方法。该方法在不使用额外样本数据的情况下,利用非监督深层模型KPCANet对分块后的人脸图像进行训练并利用KPCA学习得到的波器进行特征提取,从而保证了提取的特征对光照及遮挡的鲁棒性,同时也消除了人脸局部形变对识别率的影响。本文通过投票的方法融合每一个分块的预测值来得到最后的识别结果,对于单次投票结果不唯一的情况,本文采取了二阶段的投票方法,通过扩大每一块的预测候选集,并对不同的区域赋子不同的权值来得出最后的结果,从而进一步提升了识别的准确率。实验结果表明,该方法在四个公开人脸数据集上都取得了优异的表现,算法准确率优于使用了额外数据集的通用方法,尤其是在非限制人脸数据集LFW-a上,本文提出的方法比sVDL和LGR方法准确率提升了约15%.
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值