ICS-GNN:Lightweight Interactive Community Search via Graph Neural Network

1.问题定义

  • 给定一个查询节点,求出此节点所属的社区。社区搜索用途(可以为许多应用提供候选集:friend recommendations,fraudulent graph discover)

2.现存方法缺点

  • 1)先爬取大部分的网络数据,然后从中寻找社区,但是爬取的数据很大一部分对终端用户没用。并且不能实时爬取数据,将数据爬取和社区搜索分开。
  • 2)使用人工定义的规则评价社区好坏,社区结构是灵活的,不能有效的评估
  • 3)根据预定义的规则(k-core,k-truss)在真实的数据中很难发现高质量的社区

3.本文工作

  • 从在线网络中实时收集的子图中,定位目标社区
  • 将社区问题定义为节点分类问题,通过GNN学习到每个节点基于查询节点的嵌入向量,将向量送入多分类器进行分类,寻找社区,找出的社区通过用户打的标签判定社区好坏,优化损失函数,学习权重参数(Q:每次都是基于特定节点训练的网络,下一次输入另一个不同的查询节点时,基于之前训练的模型得到的嵌入是不是不准确
  • 每次迭代中,根据查询节点和标记的节点 ,爬取候选字图,用训练的GNN模型评估节点分数,发现KMG社区,用户评价社区好坏,获得反馈,若训练的模型不佳,根据反馈重新训练网络结构

4.创新点

  • 爬取数据和社区搜索交替进行 (???)
  • 根据查询节点有目标的爬取相关的子图
  • 通过深度学习,根据节点的结构和内容特征,学习节点的表示,进而进行分类

5.为什么是轻量级的(Lightweight)

  • 爬取和查询节点相关的有用数据子图,降低后序社区搜索的花费
  • 只需用户标记节点是否在社区中,传统方法(k-core,k-truss)需要用户不断地调整参数K
  • 可以利用已经训练好的关键字(节点的特征)表示,这些关键字已经从大量数据中捕获到了关系

6.文章贡献

  • 通过GNN模型结合内容和结构特征,选取GNN得分最大的k-size子图(KMG community)
  • 通过BFS和局部边缘增强策略构建候选字图 ,用GNN模型计算每个节点在社区中的概率,通过vertex-swapping 方法定位社区
  • 两种优化策略
    在GNN模型中加入基于排序的损失函数 ,简化标记任务(labeling tasks)
    用贪心算法定位KMG社区

7.GNN

  • 本质
    捕获内容特性和结构关系来学习节点的高维表示,主要包括两个函数,aggregate function(从不同权重的邻居中聚合embedding,要求聚合结果和输入的邻居节点顺序无关,常见的聚合函数 sum,mean),update function将embedding变形成新的表示(通常通过激活函数进行非线性变换)
    图注:节点嵌入初始化(直接用各个节点的特征矩阵)
    在这里插入图片描述
    图注:利用GCN学习节点嵌入的过程
    在这里插入图片描述

  • GNN变体
    给邻居分配权重以及聚合邻居信息时存在差异,产生不同的GNN变体,GCN(聚合所有邻居的信息),GraphSage(对邻居节点抽样操作,不聚合所有邻居),GAT(使用注意力机制确定邻居的权重)

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
C语言是一种广泛使用的编程语言,它具有高效、灵活、可移植性强等特点,被广泛应用于操作系统、嵌入式系统、数据库、编译器等领域的开发。C语言的基本语法包括变量、数据类型、运算符、控制结构(如if语句、循环语句等)、函数、指针等。下面详细介绍C语言的基本概念和语法。 1. 变量和数据类型 在C语言中,变量用于存储数据,数据类型用于定义变量的类型和范围。C语言支持多种数据类型,包括基本数据类型(如int、float、char等)和复合数据类型(如结构体、联合等)。 2. 运算符 C语言中常用的运算符包括算术运算符(如+、、、/等)、关系运算符(如==、!=、、=、<、<=等)、逻辑运算符(如&&、||、!等)。此外,还有位运算符(如&、|、^等)和指针运算符(如、等)。 3. 控制结构 C语言中常用的控制结构包括if语句、循环语句(如for、while等)和switch语句。通过这些控制结构,可以实现程序的分支、循环和多路选择等功能。 4. 函数 函数是C语言中用于封装代码的单元,可以实现代码的复用和模块化。C语言中定义函数使用关键字“void”或返回值类型(如int、float等),并通过“{”和“}”括起来的代码块来实现函数的功能。 5. 指针 指针是C语言中用于存储变量地址的变量。通过指针,可以实现对内存的间接访问和修改。C语言中定义指针使用星号()符号,指向数组、字符串和结构体等数据结构时,还需要注意数组名和字符串常量的特殊性质。 6. 数组和字符串 数组是C语言中用于存储同类型数据的结构,可以通过索引访问和修改数组中的元素。字符串是C语言中用于存储文本数据的特殊类型,通常以字符串常量的形式出现,用双引号("...")括起来,末尾自动添加'\0'字符。 7. 结构体和联合 结构体和联合是C语言中用于存储不同类型数据的复合数据类型。结构体由多个成员组成,每个成员可以是不同的数据类型;联合由多个变量组成,它们共用同一块内存空间。通过结构体和联合,可以实现数据的封装和抽象。 8. 文件操作 C语言中通过文件操作函数(如fopen、fclose、fread、fwrite等)实现对文件的读写操作。文件操作函数通常返回文件指针,用于表示打开的文件。通过文件指针,可以进行文件的定位、读写等操作。 总之,C语言是一种功能强大、灵活高效的编程语言,广泛应用于各种领域。掌握C语言的基本语法和数据结构,可以为编程学习和实践打下坚实的基础。
该资源内项目源码是个人的课程设计、毕业设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 该资源内项目源码是个人的课程设计,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! ## 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值