自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 基于最近邻的异常检测 (2)——LOF方法

前面提到,Distance-based算法在全局语境(全局数据)下的异常检测表现良好,那么Distance-based算法是否有能力在局部环境下对目标进行建模吗?事实上,Distance-based算法只能刻画目标的k邻近绝对密度,无法对相对密度(相对于局部数据)建模。值得注意的是,现实中不同的上下文语境下,目标的含义可能截然不同。举个例子,普通人的平均智商是90~110(全局),所以一个智商...

2019-06-21 15:57:16 3672

原创 基于最近邻的异常检测 (1)——Distance-based方法

因为论文的需要,涉及到许多无监督异常检测算法。为了便于知识管理,打算对基于最邻近(k-NN,kth-NN,LOF,Loop等)、基于统计(HBOS)和孤立森林(Isolation Forest)算法进行总结。目前,无监督异常检测算法通常是设计某种策略为每一个数据样本分配相应的异常值得分,根据得分进行排序(得分越高,异常的程度越大),选择TOPn作为异常目标,其中n的设置需要经验知识。 ...

2019-06-19 19:43:46 3504

原创 HBOS——基于频数直方图的无监督异常点检测算法

异常点检测是数据挖掘一个重要问题,当前的算法可以简单的分为监督、半监督和无监督的方法。对于存在标签的数据,监督算法是首选(能获得很好的效果),此时异常点检测可以等价于非平衡数据分类问题。但是,实际应用中往往只有正常样本的标签,这时需要无监督方法大显神威。无监督方法也更符合人类的认识行为。比如,一个人从来没有见过斑马,但是在一群马中他也可以很容易辨别出斑马,尽管完全不知道“斑马”是什么物种。需要...

2019-04-11 12:07:01 4510

转载 异常点/离群点/Outlier Detection/Anomaly Detection检测算法

知乎中一个关于常见异常点检测算法的使用心得和见解。https://www.zhihu.com/question/280696035/answer/417091151

2019-03-05 18:10:45 2634

原创 DTW Barycenter Averaging(DBA)——平均序列求法

DBA该算法是用来求序列数据集SS的一致序列(平均序列)。由Franc-ois Petitjean提出的。目前,该方法求得的平均序列是最准确的。 假设一元组为S={s1,s2,⋯,sn}S={s1,s2,\cdots,sn},当SS中的元素为实数时,很容易求的SS的平均值: avg=s1+s2+⋯+snn(1) avg = \dfrac{s1 +s2+\cdots+sn}{n} \qquad\q

2017-08-17 23:32:55 10094 8

原创 WinXP 32bit下安装theano和Keras

WinXP 32bit下安装theano和Keras在自己的老爷机上折腾了好几天终于装上了theano和keras,接下来打算花精力学习keras,因为自己在安装上碰到很多问题,为了给和我一样想要学习keras的读者一点点帮助,同时也避免自己以后需要,先记下为好。**注:网上可以找到很多win7以上系统的theano安装方法,方法都是大同小异的,我在另一台电脑(win7)上试验可行,所以如果你是w

2017-05-23 20:55:07 800

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除