【文献阅读】CGNN: A Compatibility-Aware Graph Neural Network for Social Media Bot Detection

最新推荐文章于 2024-07-21 07:50:37 发布

IFTICing

最新推荐文章于 2024-07-21 07:50:37 发布

阅读量924

点赞数 18

文章标签：深度学习神经网络机器学习 python 人工智能

本文链接：https://blog.csdn.net/weixin_42726068/article/details/140369452

版权

introduction

现有基于GNN的社交机器人检测方法往往未能考虑社交媒体上下文中用户之间的异质关联，特别是网络中社交机器人与人类社区的异质整合。这使得从不同邻居聚合信息成为导致两种用户类型之间最终用户表示缺乏差异性。现有GNNs在提高属于同一类别但表现出不同邻居偏好的节点性能方面仍存在困难。

多样连接模式：一些社交机器人表现出紧密的连接，而另一些主要是网络机器人，则频繁与人类用户互动。这种差异强调了对社交媒体用户进行全面画像的必要性。

基于马尔科夫随机场：可以概括为各种术语之间的关联。这些关联意味着一个术语的值会影响其他术语的值。在社交机器人检测中，此处只考虑两类用户：人类用户和社交机器人。因此，每条边的兼容性权重矩阵是一个2×2的实值矩阵。其四个术语中的每一个都表示该用户对的类别属于以下四种对中的一种的伪概率：人类–人类、人类–机器人、机器人–人类和机器人–机器人。

首先，从每个用户的推文文本中提取统计特征，以生成CGNN的原始特征输入。然后，为了表征社交媒体上下文中多样的邻居关联，设计了一个边类别原型网络（ECPN）来模拟每条边的兼容性权重矩阵。为了缓解异质兼容性函数中的潜在过参数化问题，利用共享编码器网络和四个原型对ECPN进行参数化。之后，使用消息聚合网络（MAN）从相邻节点收集信息并更新节点表示。得益于有效的信息传递权重，CGNN仅使用简单的线性信息传递策略就能在社交机器人检测中实现卓越的性能，从而通过消除GNNs中常用的节点特征变换来提高效率。

贡献总结如下：

为了进一步提高基于GNN的社交机器人检测方法的效能和效率，提出了考虑社交媒体上下文中的异质兼容性。
基于提出的异质兼容性视角，引入了一个CGNN。该网络结合了ECPN和MAN。ECPN通过显式学习每条边的兼容性权重矩阵来表征变化的关联，以增强网络在多样邻居偏好的社交媒体上下文中识别社交机器人的能力。
大量实验表明，CGNN在三个常用的社交机器人检测基准上实现了SOTA性能。与之前的SOTA方法相比，它仅使用了大约2%的参数规模和10%的训练时间。

related works

之后总结

method

在这里插入图片描述

Structure and Feature Processing Module

与语言无关的非文本推文特征、与语言相关的文本推文特征和元数据特征：

细节：
将用户的推文分类为三种类型：原始推文、转发和回复。随后，分别计算这些类别中的提及、标签、URL、表情符号和文本长度等统计特征，构成用户的非文本推文特征。

用户的文本阅读易度特征：

可读性指标：

使用一些英语的统计可读性指标，对于每个用户，根据可读性指标计算其所有推文的均值、方差、偏度和峰度。

https://www.kancloud.cn/yxmtjs/zettlr/2646008

写作风格指标：

采用写作风格特征来区分人类用户和社交机器人。这些特征包括词长、不同词性的词汇频率和各种标点符号频率。类似地，写作风格特征是根据写作风格指标计算每个用户的所有推文的均值和方差。

在这里插入图片描述
$\in {1, 2, 3, 4}$ 对应四类主要特征：数值、分类、非文本和文本。

Overview of Compatibility-Aware GNN Encoder

CGNN由ECPN和MAN。

ECPN是学习边缘嵌入向量的关键组件，用于表征兼容性、分类边缘和确定消息传递权重。（计算相邻节点之间的兼容性和相应的消息传递权重。）
MAN在更新节点表示中起关键作用。（注意机制聚合）

ECPN

在这里插入图片描述在 ECPN 的开始阶段，利用三层线性层生成边嵌入向量，边的端点表示作为输入。首先，对源节点和目标节点分别应用两个线性投影和激活，以减少表示维度。随后，将降维后的表示连接起来，并通过另一层线性变换处理以合并来自两个端点的信息。
在这里插入图片描述在原型构建方面，为了简化模型设计，边类别原型通过对一部分边的表示取平均来获得。这些边的端点属于相应类别，并且同时出现在训练集中：
其中，对于训练集中不存在的特定边类别，采用零填充来补充相应的原型。

最终，由于两类用户作为邻居共存以及邻居之间关系的不同，需要原型网络确定并分配自适应传播权重给边。此外，将实际消息传递权重和学习到的兼容性权重之间的差距弥合需要将学习到的权重矩阵转换为每条边的单一消息传递权重，以便执行消息传播过程。

这里采用了一种贪心方法进行转换。每条边的类别通过选择相似度最高的项来确定，消息传递权重根据该项的相似度分配：
在这里插入图片描述

MAN

在这里插入图片描述

IFTICing

关注

18
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
【文献阅读】CGNN: A Compatibility-Aware Graph Neural Network for Social Media Bot Detection

现有基于GNN的社交机器人检测方法往往未能考虑社交媒体上下文中用户之间的异质关联，特别是网络中社交机器人与人类社区的异质整合。这使得从不同邻居聚合信息成为导致两种用户类型之间最终用户表示缺乏差异性。现有GNNs在提高属于同一类别但表现出不同邻居偏好的节点性能方面仍存在困难。多样连接模式：一些社交机器人表现出紧密的连接，而另一些主要是网络机器人，则频繁与人类用户互动。这种差异强调了对社交媒体用户进行全面画像的必要性。基于马尔科夫随机场：可以概括为各种术语之间的关联。
复制链接

扫一扫