社区发现
风景不在对岸wj
这个作者很懒,什么都没留下…
展开
-
社区发现的3个评估指标:标准化互信息NMI,ARI指标,以及模块度(modularity)
原文地址:一、已知真实社区划分结果1.NMI指数,互信息和标准化互信息 具体公式和matlab代码参见博客,Python代码参加,C++代码参见123456789101112131415161718转载 2017-07-10 19:15:41 · 16562 阅读 · 1 评论 -
从拉普拉斯矩阵说到谱聚类
原文地址0 引言 11月1日上午,机器学习班 第7次课,邹讲聚类(PPT),其中的谱聚类引起了自己的兴趣,邹从最基本的概念:单位向量、两个向量的正交、方阵的特征值和特征向量,讲到相似度图、拉普拉斯矩阵,最后讲谱聚类的目标函数和其算法流程。 课后自己又琢磨了番谱聚类跟拉普拉斯矩阵,打算写篇博客记录学习心得, 若有不足或建议,欢迎随时不吝指出,thanks。转载 2017-08-29 11:29:29 · 585 阅读 · 0 评论 -
社区发现算法(三)
版权声明:本文为博主原创文章,未经博主允许不得转载。http://blog.csdn.net/aspirinvagrant派系过滤CPM方法(clique percolation method)用于发现重叠社区,派系(clique)是任意两点都相连的顶点的集合,即完全子图。在社区内部节点之间连接密切,边密度高,容易形成派系(clique)。因此,社区内部的边有较大可能形成大转载 2017-08-31 15:08:53 · 3188 阅读 · 0 评论 -
CPM(Cluster Percolation method)派系过滤算法
原文地址一、概念(1)完全子图/全耦合网络/k-派系:所有节点全部两两相连 图1这些全耦合网络也成为派系,k-派系表示该全耦合网络的节点数目为k1)k-派系相邻:两个不同的k-派系共享k-1个节点,认为他们相邻2)k-派系连通:一个k-派系可以通过若干个相邻的k-派系到达另转载 2017-08-31 15:11:30 · 9201 阅读 · 6 评论 -
多目标进化算法(MOEAs)概述
原文地址对于大多数多目标优化问题,其各个目标往往是相互冲突的,因此不可能使得所有的目标同时达到最优,而是一组各个目标值所折衷的解集,称之为Pareto最优集。以下为一些基本定义(以最小化优化问题为例):Definition 1: 多目标优化问题(multi-objective optimization problem(MOP)) F(x)=(f1(x),…,fm(x))s.t.转载 2017-08-31 15:20:12 · 17164 阅读 · 0 评论 -
谱聚类算法及其代码(Spectral Clustering)
简介文章将介绍谱聚类(spectral clustering)的基本算法,以及在matlab下的代码实现。介绍内容将包括:从图分割角度直观理解谱聚类谱聚类算法步骤数据以及实现代码本文将不会涉及细节化的证明和推导,如有兴趣可参考july大神的文章从拉普拉斯矩阵说到谱聚类.对谱聚类的理解这一节将从图分割聚类的角度直观理解谱聚类。不过,因为本人是从事社交媒体分析的转载 2017-12-26 20:42:41 · 8798 阅读 · 5 评论 -
Fast unfolding of communities in large networks
接着上文,我们需要进一步了解Gephi工具计算modularity的算法。在Gephi社区中,有文档Modularity - Gephi Wiki说明了算法[1]。What & Why Community Detection在直接进入文章之前,需要先了解community detection的出发点和意图。直观地说,community detection的一般目标是要探测网络中的“块”cluste转载 2018-01-17 21:55:04 · 2508 阅读 · 3 评论 -
对比欧氏距离与余弦相似度
欧式距离欧氏距离就是我们平常所说的距离,如果是平面上的两个点和 ,那么 A 与 B 的欧式距离就是;如果是三维空间中的两个点 和 ,那么 A 与 B 的欧式距离就是;如果推广到高维空间,公式可以类推,再次不再赘述(编辑公式好累……)。欧几里德距离真的是数学加减乘除算出来的距离,因此这就是只能用于连续型变量的原因。余弦相似度余弦相似度用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。...转载 2018-05-01 10:46:38 · 4897 阅读 · 1 评论 -
余弦相似度与正规化的欧氏距离的某种等价性
给一个集合V, V={x|x∈Rn}, 和一个点u∈Rn , 依次计算u与V中各个点的距离, 然后按照从近到远排序, 就可以得到一个序列A=<x1,x2,...>距离函数可以取cosine similarity 值域[-1,1], 越大表示越相近.Euclidean distance 值域 [0,+∞], 越小表示越近.在二维空间中, 余弦距离是夹角, 欧氏距离是远近. 很明显二者各自...转载 2018-05-02 16:32:02 · 1280 阅读 · 1 评论 -
关于Gephi的安装的一些问题
本人小白一名,在安装Gephi中出现的问题和解决方法再次列出,希望对大家有所帮助。摘要如何获取GephiGephi的安装过程安装中出现的问题及解决方法使用Gephi的优势摘要Gephi是一款开源免费跨平台基于JVM的复杂网络分析软件,,其主要用于各种网络和复杂系统,动态和分层图的交互可视化与探测开源工具。如何获取GephiGephi可以直接从[官方网站][1]获得。点击即可进入下载页面。Gephi...转载 2018-07-12 09:20:15 · 9950 阅读 · 0 评论 -
谱聚类(spectral clustering)原理总结
原文地址 谱聚类(spectral clustering)是广泛使用的聚类算法,比起传统的K-Means算法,谱聚类对数据分布的适应性更强,聚类效果也很优秀,同时聚类的计算量也小很多,更加难能可贵的是实现起来也不复杂。在处理实际的聚类问题时,个人认为谱聚类是应该首先考虑的几种算法之一。下面我们就对谱聚类的算法原理做一个总结。1. 谱聚类概述 谱聚类是从图论中演化出来的转载 2017-08-29 11:16:18 · 1311 阅读 · 0 评论 -
拉普拉斯矩阵/映射/聚类
原文地址拉普拉斯矩阵是个非常巧妙的东西,它是描述图的一种矩阵,在降维,分类,聚类等机器学习的领域有很广泛的应用。什么是拉普拉斯矩阵拉普拉斯矩阵 先说一下什么是拉普拉斯矩阵,英文名为Laplacian matrix,其具体形式得先从图说起,假设有个无向图如下所示, 其各个点之间的都有相应的边连接,我们用某个指标(这地方可以任意选择,比如欧转载 2017-08-12 10:12:14 · 1595 阅读 · 0 评论 -
Kernighan-Lin算法
注意:之前对于公式用LATEX编写,复制的图片,不知怎么就显示不出,凡是框框的地方,用文字表示了公式。 Kernighan-Lin算法是一种启发式算法,基于贪婪原理将网络划分为两个大小已知的社团。 所要解决的问题描述:给定一个无向带权图G=(V,E,C),其中V为一含有2n个节点的集合,E为边集合,C为2n*2n且对称的权重矩阵(Cij表示节点i和节点j直接转载 2017-08-18 10:59:28 · 15514 阅读 · 4 评论 -
模块度与Louvain社区发现算法
Louvain算法是基于模块度的社区发现算法,该算法在效率和效果上都表现较好,并且能够发现层次性的社区结构,其优化目标是最大化整个社区网络的模块度。模块度(Modularity ) 模块度是评估一个社区网络划分好坏的度量方法,它的物理含义是社区内节点的连边数与随机情况下的边数只差,它的取值范围是 [−1/2,1),其定义如下:Q=12m∑i,j[Aij−kikj2转载 2017-08-02 11:23:01 · 3732 阅读 · 0 评论 -
欢迎使用CSDN-markdown编辑器
Louvain算法是基于模块度的社区发现算法,该算法在效率和效果上都表现较好,并且能够发现层次性的社区结构,其优化目标是最大化整个社区网络的模块度。模块度(Modularity ) 模块度是评估一个社区网络划分好坏的度量方法,它的物理含义是社区内节点的连边数与随机情况下的边数只差,它的取值范围是 [−1/2,1),其定义如下:Q=12m∑i,j[Aij−kikj2m]δ(ci,cj)Q = \fr转载 2017-08-02 11:44:55 · 236 阅读 · 0 评论 -
Science14年的聚类论文——Clustering by fast search and find of density peaks
欢迎转载,转载请注明:本文出自Bin的专栏blog.csdn.NET/xbinworld。这是一个比较新的聚类方法(文章中没看见作者对其取名,在这里我姑且称该方法为local density clustering,LDC),在聚类这个古老的主题上似乎最近一些年的突破不大,这篇文章算是很好的了,方法让人很有启发(醍醐灌顶),并且是发表在Science上,受到的关注自然非常大。本文的核转载 2017-08-02 17:08:17 · 3964 阅读 · 0 评论 -
LFR简单使用入门
1. 运行环境LFR程序下载链接, 运行环境为Linux、g++1.1 先安装build-essential:(可省略)$ sudo apt-get install build-essential1.2 查看 gcc 版本$ gcc --versiongcc (Ubuntu/Linaro 4.6.3-1ubuntu5) 4.6.3Copyright (C) 2011转载 2017-08-02 17:42:19 · 4733 阅读 · 1 评论 -
聚类(1)——混合高斯模型 Gaussian Mixture Model
聚类系列:聚类(序)----监督学习与无监督学习聚类(1)----混合高斯模型 Gaussian Mixture Model 聚类(2)----层次聚类 Hierarchical Clustering 聚类(3)----谱聚类 Spectral Clustering--------------------------------转载 2017-08-03 08:51:55 · 913 阅读 · 0 评论 -
聚类(2)——层次聚类 Hierarchical Clustering
聚类系列:聚类(序)----监督学习与无监督学习聚类(1)----混合高斯模型 Gaussian Mixture Model 聚类(2)----层次聚类 Hierarchical Clustering 聚类(2*)----k-means如何训练很大的码书聚类(3)----谱聚类 Spectral Clustering-------------转载 2017-08-03 08:52:01 · 1052 阅读 · 0 评论 -
Pareto(帕雷托)相关知识
原文地址:Pareto(帕雷托)相关知识作者:XIAO_QingJun1879年,经济学家意大利人维弗雷多·帕雷托 (Villefredo Pareto) 提出:社会财富的80%是掌握在20%的人手中,而余下的80%的人只占有20%的财富。渐渐地,这种“关键的少数(vital few)和次要的多数(trivial many)”的理论,被广为应用在社会学和经济学中,并被成之为Pareto转载 2017-08-17 11:26:40 · 6131 阅读 · 2 评论 -
NMF 非负矩阵分解 -- 原理与应用
原文地址1.原理发现写关于非负矩阵的博文还是蛮多的,还是以自己的角度总结一下自己的最近看的若干东西以及对非负矩阵分解有用的一些资料链接。NMF,全称为non-negative matrix factorization,中文呢为“非负矩阵分解”。NMF的思想:V=WH(W权重矩阵、H特征矩阵、V原矩阵),通过计算从原矩阵提取权重和特征两个不同的矩阵出来转载 2017-08-17 20:05:56 · 12338 阅读 · 0 评论 -
NMF 非负矩阵分解(Non-negative Matrix Factorization)实践
原文地址1. NMF-based 推荐算法在例如Netflix或MovieLens这样的推荐系统中,有用户和电影两个集合。给出每个用户对部分电影的打分,希望预测该用户对其他没看过电影的打分值,这样可以根据打分值为其做出推荐。用户和电影的关系,可以用一个矩阵来表示,每一列表示用户,每一行表示电影,每个元素的值表示用户对已经看过的电影的打分。下面来简单介绍一下基于NMF的推荐算法。转载 2017-08-17 20:29:43 · 1577 阅读 · 0 评论 -
Gephi学习笔记-画出图形基本流程
1、数据准备 这里准备的是csv格式的数据,没有用数据库导入等方式。 格式如下图所示,这里表示的是一个有权有向图,Source为源节点,Target为目标节点,Weight为权重。将其利用记事本打开,保存成ANSI格式(配套后面的Gephi的一些设置,保证中文标签正常显示) 2、Gephi软件准备这里用的是Gephi 0.9.1①打开“数据资料”选项卡,点击“输入电子表格” ②...转载 2018-07-12 15:20:31 · 2983 阅读 · 1 评论