图挖掘、社会网络分析和多关系数据挖掘

 

 

 

1.图挖掘的主要目标

答:挖掘频繁子结构是图集合中非常基本的模式。频繁子结构可以刻画集合的特征,区分不同的组群体,对图进行分类和聚类,构造图索引和更方便地在图数据库中进行相似性搜索。

频繁图的基本定义:图g的顶点集合用V(g)表示,边集合用E(g)表示。标号函数L将顶点或边映射到标号。图g是另一个图G的子图,如果存在从图g到图G的子图同构。给定一个标记的图数据集D={G1,G2,G3,... ... ,Gn},图g的支持度support(g)或者频度frequency(g)定义为g作为子图在D中出现的百分比或者次数。频繁图是支持度不小于最小支持度阈值min_sup的图。

发现频繁子结构的步骤通常有两个:1、产生频繁子结构的候选;2、检查每个候选的频度。大多数的频繁子结构发现的研究都集中在第一步的优化,因为第二步包含子图同构检验,计算复杂度相当高。目前有两种基本方法:Apriori方法和模式增长方法。Apriori方法频繁子结构挖掘算法的频繁图搜索开始于小规模图,按照自底向上的方式产生具有附加顶点、变或路径的候选图。图规模的定义依赖于使用的算法。根据自底向上的策略的选择,也产生了具体的算法,分为顶点、边、边不相交路径的具体实施策略。Apriori方法是基于图的广度优先搜索进行的。模式增长方法比Apriori方法更加灵活,可以根据实际需要采用图的广度优先搜索或者深度优先搜索。模式增长方法是选择以边为增长策略的,也是自底向上增长策略进行,它对每次增长的边用从增长原点到新增长边的顶点序列记录,然后对附加完成增长边的子图计算频繁度,考察新增长的边对频繁度的影响程度,记录频度,

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值