高三学生发表AI论文，提出针对网络暴力问题的新模型AdaGCN

最新推荐文章于 2023-04-14 21:38:51 发布

AI科技大本营

最新推荐文章于 2023-04-14 21:38:51 发布

阅读量5k

点赞数 8

原文链接：https://bss.csdn.net/m/zone/bdtc2019/guest

版权

作者 | 神经小兮

来源 | HyperAI超神经（ID：HyperAI）

【导读】近日，在清华大学举行的丘成桐中学科学奖半决赛落下帷幕，来自海内外的 72 支队伍获得了总决赛的入场券，北京师范大学附属实验中学的高三学生白行健，也在其中。他凭借一篇利用图卷积神经网络检测网络暴力的论文，在比赛中脱颖而出。长江后浪推前浪，瞧，00 后也要出道了。

高三的时候，你在做什么呢？刷《五年高考三年模拟》？还是背英语单词？

一名叫做白行健的北京师范大学附属实验中学高三学生，已经在研究神经网络了，而且带着最新论文，入围丘成桐中学科学奖决赛。

用卷积神经网络，检测网络暴力

白行健目前是北京师范大学附属实验中学（简称北师大实验）国际部高三学生，热爱数学和计算机科学，担任学校计算机社社长和⼈⽂社社长。

他本次参赛的论文标题为《基于自适应性图卷积神经网络的暴力用户检测》，论⽂提出了⼀种新的⾃适应图卷积神经⽹络模型（Adaptive Graph Convolutional Neural Networks，简称AdaGCN），是在传统的 GCN 模型的基础上做了改进和创新。

在新模型中，边权被设置为可训练的变量，这允许模型⾃适应性地学习⽤户之间关系的权重。⼀个值得关注的问题是，虽然可训练的边权提升了模型的能⼒，但是参数的增加会导致模型更难训练并可能发⽣过拟合。

为了解决这个问题，本⽂引⼊标签平滑假设（Label Smoothness Assumption），即在社交⽹络上相邻的两个⽤户更有可能会有相同的标签（即他们更有可能同时为暴⼒⽤户或同时为正常⽤户）。本⽂使⽤标签平滑假设对边权的训练施加了额外的监督。

具体来说，本⽂引⼊标签传播算法（Label Propagation Algorithm ，简称 LPA），并设计了丢⼀损失（the leave-one-out loss）作为标签平滑假设的具体实现，从⽽实现了和 GCN 模型的⾃然结合。

LPA 与丢一损失结合（左）

AdaGCN 的传播方案，其中特征向量和标签同时传播（右）

本⽂在 Manoel Horta Ribeiro 等⼈收集的数据集上应⽤了 AdaGCN 模型。该数据集包含了 10 万余名 Twitter ⽤户和 200 余万条社交关系，其中⼤约 5 千名⽤户被标注了是否为暴⼒⽤户。

实验结果表明，AdaGCN 的 AUC 得分为 0.80，F1 得分为 0.47，得分⾼于所有对⽐⽅法，包括传统的 GCN 模型、图注意⼒⽹络 (GAT)、标签传播算法（LPA）、⽀持向量机（SVM）等等。此外，AdaGCN 模型的结果具有最低的标准差，这表明 AdaGCN 模型具有很强的稳定性。

在训练集上 LOSS、AUC 和 FI （从左至右）得分

论文中指出，在线社交平台可以利⽤本⽂提出的⽅法来更好地评估、检测暴⼒⽤户，防⽌暴⼒⽤户伤害他⼈并传播仇恨⾔论。 同时，⾃适应图卷积神经⽹络模型，也可以⽤来评估不同类型的暴⼒⾔论造成的社会影响。

有技术，有情怀

网络暴力的确已经是这个时代的一种新的暴力形式，它可能无形中带给当事人巨大的伤害，甚至最终酿成严重后果。

在本次比赛中，白行健选择用技术检测网络暴力问题，因为身处互联网时代的他，也亲眼看到过身边的朋友遭遇网络暴力，而他选择用技术来帮助受害者。

前段时间，韩国女星崔雪莉的死亡

引发了一场「拒绝网络暴力」的讨论

白行健在论文中解释道，「2018 年 2 ⽉ 10 ⽇，⼀个名叫 Ted Senior 的 22 岁男孩在林地上吊⾃杀，原因是⼀些⼈在社交媒体上恶意地分享和评判他与⼀名⼥孩的聊天内容。

在我身边，我的同学好友在学校论坛发表观点，但是遭受匿名的辱骂和攻击，这种羞辱让他感到⾮常痛苦。我深深地被这些可恨的⾏为和可怕的后果所触动。计算机科学带来了信息时代，社交⽹络改变了我们的⽣活，我们期望技术会让世界更美好。但没有什么是尽善尽美的。⽹络暴⼒是信息技术⽆意中带来的⼀个问题，我渴望找到⼀种⽅法来发现和控制它们。」