模块度Q——复杂网络社区划分评价标准

对复杂网络进行社区划分,需要有一些评价指标,来评判算法对网络划分结果的好坏优劣。如果我们预先知道网络的真实划分结果,那么我们可以用NMI(归一化互信息)去衡量算法划分结果和真实结果的重合程度,这个会在以后的文章中具体介绍。大多数情况下,我们是不知道网络的真实划分的,尤其是对于大型网络来说更是如此,...

2016-07-27 18:35:25

阅读数 15845

评论数 15

并查集——求无向图的所有连通子图

并查集——求无向图的所有连通子图  求解无向图的连通子图,有两种方法,一种是DFS或BFS,也就是对图遍历,另一种方法就是使用并查集。对图的遍历非常常见,而并查集的概念就不如遍历那么熟悉。其实如果仅是找连通子图,用DFS对所有节点遍历一遍就可以,而用并查集则需要遍历两遍。我们不考虑算法效率问题,仅...

2016-07-22 20:42:56

阅读数 9517

评论数 2

异常点/离群点检测算法——LOF

局部异常因子算法-Local Outlier Factor(LOF)  在数据挖掘方面,经常需要在做特征工程和模型训练之前对数据进行清洗,剔除无效数据和异常数据。异常检测也是数据挖掘的一个方向,用于反作弊、伪基站、金融诈骗等领域。   异常检测方法,针对不同的数据形式,有不同的实现方法。常用的有...

2016-06-18 15:18:21

阅读数 57100

评论数 30

Python实现可自定义更新策略的LRU Cache

LRU Cache  LRU(Least Recently Used),直译为“最近最少使用”,其实称“最久未被使用”更为恰当。这是一个非常重要的算法,在学操作系统的时候第一次遇见,在做leetcode的时候再次遇见,知道是用于做缓存的页面置换。但是LRU不仅仅用于这一个用途,凡是有数据更新策略的...

2016-05-26 15:25:12

阅读数 2579

评论数 0

Gunicorn启动Thrift服务

用Gunicorn启动Thrift服务  开始写博客,记录,总结,分享。   今天写一下关于Gunicorn和thrift的使用,也是最近做项目时用到的技术。关于thrift,网上都有很多介绍,不必多说。thrift支持很多语言,我们现在需要用到python做一些服务的事情,所以下面主要说的是t...

2016-05-03 21:05:01

阅读数 2686

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭