- 博客(5)
- 收藏
- 关注
原创 模块度Q——复杂网络社区划分评价标准
对复杂网络进行社区划分,需要有一些评价指标,来评判算法对网络划分结果的好坏优劣。如果我们预先知道网络的真实划分结果,那么我们可以用NMI(归一化互信息)去衡量算法划分结果和真实结果的重合程度,这个会在以后的文章中具体介绍。大多数情况下,我们是不知道网络的真实划分的,尤其是对于大型网络来说更是如此,复杂网络的命名明确的说明了这种现实情况。但是我们依然有方法可以量化或评判我们的社区划分水平,也就是今天要
2016-07-27 18:35:25 61405 41
原创 并查集——求无向图的所有连通子图
并查集——求无向图的所有连通子图 求解无向图的连通子图,有两种方法,一种是DFS或BFS,也就是对图遍历,另一种方法就是使用并查集。对图的遍历非常常见,而并查集的概念就不如遍历那么熟悉。其实如果仅是找连通子图,用DFS对所有节点遍历一遍就可以,而用并查集则需要遍历两遍。我们不考虑算法效率问题,仅仅是通过这个问题让我们对并查集有所认识,并了解其原理,下面主要说一下并查集。 首先说一下,并查集是
2016-07-22 20:42:56 32910 7
原创 异常点/离群点检测算法——LOF
局部异常因子算法-Local Outlier Factor(LOF) 在数据挖掘方面,经常需要在做特征工程和模型训练之前对数据进行清洗,剔除无效数据和异常数据。异常检测也是数据挖掘的一个方向,用于反作弊、伪基站、金融诈骗等领域。 异常检测方法,针对不同的数据形式,有不同的实现方法。常用的有基于分布的方法,在上、下α分为点之外的值认为是异常值(例如图1),对于属性值常用此类方法。基于距离的方法
2016-06-18 15:18:21 172710 52
原创 Python实现可自定义更新策略的LRU Cache
LRU Cache LRU(Least Recently Used),直译为“最近最少使用”,其实称“最久未被使用”更为恰当。这是一个非常重要的算法,在学操作系统的时候第一次遇见,在做leetcode的时候再次遇见,知道是用于做缓存的页面置换。但是LRU不仅仅用于这一个用途,凡是有数据更新策略的应用,LRU都可以是候选算法。比如redis、memcached、oracle等缓存和数据库、或在其它应
2016-05-26 15:25:12 4629
原创 Gunicorn启动Thrift服务
用Gunicorn启动Thrift服务 开始写博客,记录,总结,分享。 今天写一下关于Gunicorn和thrift的使用,也是最近做项目时用到的技术。关于thrift,网上都有很多介绍,不必多说。thrift支持很多语言,我们现在需要用到python做一些服务的事情,所以下面主要说的是thrift server端的内容。虽说是针对thrift的内容,但是thrift只是问题所在,主要的解决
2016-05-03 21:05:01 5202
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人