自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 模块度Q——复杂网络社区划分评价标准

对复杂网络进行社区划分,需要有一些评价指标,来评判算法对网络划分结果的好坏优劣。如果我们预先知道网络的真实划分结果,那么我们可以用NMI(归一化互信息)去衡量算法划分结果和真实结果的重合程度,这个会在以后的文章中具体介绍。大多数情况下,我们是不知道网络的真实划分的,尤其是对于大型网络来说更是如此,复杂网络的命名明确的说明了这种现实情况。但是我们依然有方法可以量化或评判我们的社区划分水平,也就是今天要

2016-07-27 18:35:25 61224 41

原创 并查集——求无向图的所有连通子图

并查集——求无向图的所有连通子图  求解无向图的连通子图,有两种方法,一种是DFS或BFS,也就是对图遍历,另一种方法就是使用并查集。对图的遍历非常常见,而并查集的概念就不如遍历那么熟悉。其实如果仅是找连通子图,用DFS对所有节点遍历一遍就可以,而用并查集则需要遍历两遍。我们不考虑算法效率问题,仅仅是通过这个问题让我们对并查集有所认识,并了解其原理,下面主要说一下并查集。   首先说一下,并查集是

2016-07-22 20:42:56 32848 7

原创 异常点/离群点检测算法——LOF

局部异常因子算法-Local Outlier Factor(LOF)  在数据挖掘方面,经常需要在做特征工程和模型训练之前对数据进行清洗,剔除无效数据和异常数据。异常检测也是数据挖掘的一个方向,用于反作弊、伪基站、金融诈骗等领域。   异常检测方法,针对不同的数据形式,有不同的实现方法。常用的有基于分布的方法,在上、下α分为点之外的值认为是异常值(例如图1),对于属性值常用此类方法。基于距离的方法

2016-06-18 15:18:21 172665 52

原创 Python实现可自定义更新策略的LRU Cache

LRU Cache  LRU(Least Recently Used),直译为“最近最少使用”,其实称“最久未被使用”更为恰当。这是一个非常重要的算法,在学操作系统的时候第一次遇见,在做leetcode的时候再次遇见,知道是用于做缓存的页面置换。但是LRU不仅仅用于这一个用途,凡是有数据更新策略的应用,LRU都可以是候选算法。比如redis、memcached、oracle等缓存和数据库、或在其它应

2016-05-26 15:25:12 4629

原创 Gunicorn启动Thrift服务

用Gunicorn启动Thrift服务  开始写博客,记录,总结,分享。   今天写一下关于Gunicorn和thrift的使用,也是最近做项目时用到的技术。关于thrift,网上都有很多介绍,不必多说。thrift支持很多语言,我们现在需要用到python做一些服务的事情,所以下面主要说的是thrift server端的内容。虽说是针对thrift的内容,但是thrift只是问题所在,主要的解决

2016-05-03 21:05:01 5201

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除