走在前往架构师的路上

专注于分布式计算,大数据,数据挖掘,机器学习算法等领域的研究

18大经典数据挖掘算法小结

本文所有涉及到的数据挖掘代码的都放在了我的github上了:https://github.com/linyiqun/DataMiningAlgorithm 大概花了将近2个月的时间,自己把18大数据挖掘的经典算法进行了学习并且进行了代码实现,涉及到了决策分类,聚类,链接挖掘,关联挖掘,模式挖掘等等...

2015-02-27 10:04:01

阅读数:14662

评论数:17

LZW压缩算法

介绍 LZW算法是非常常见的一种压缩算法,他的压缩原理是对于多次重复出现的字符串,进行压缩,至于怎么压缩,在后文中会细细描述,LZW算法可以用在很多的场合,诸如图像压缩,文本压缩等等,而且算法简单易懂,并不是人们想象中的那么深奥。 算法原理 在介绍算法原理之前,得先明白几个概念: 1、Pr...

2015-02-27 19:24:18

阅读数:4017

评论数:0

gSpan频繁子图挖掘算法

参考资料:http://www.cs.ucsb.edu/~xyan/papers/gSpan.pdf http://www.cs.ucsb.edu/~xyan/papers/gSpan-short.pdf http://www.jos.org.cn/1000-9825/18/2469.pdf 更多...

2015-02-24 09:37:11

阅读数:12949

评论数:25

RoughSets属性约简算法

参考资料:http://baike.baidu.com/link?url=vlCBGoGR0_97l9SQ-WNeRv7oWb-3j7c6oUnyMzQAU3PTo0fx0O5MVXxckgqUlP871xR2Le-puGfFcrA4-zIntq 更多挖掘算法:https://github.com...

2015-02-18 09:24:59

阅读数:5587

评论数:5

CBA算法---基于关联规则进行分类的算法

更多数据挖掘算法:https://github.com/linyiqun/DataMiningAlgorithm 介绍 CBA算法全称是Classification base of Association,就是基于关联规则进行分类的算法,说到关联规则,我们就会想到Apriori和FP-Tree...

2015-02-14 19:02:02

阅读数:6029

评论数:2

PrefixSpan序列模式挖掘算法

更多数据挖掘代码:https://github.com/linyiqun/DataMiningAlgorithm 介绍 与GSP一样,PrefixSpan算法也是序列模式分析算法的一种,不过与前者不同的是PrefixSpan算法不产生任何的侯选集,在这点上可以说已经比GSP好很多了。PrefixS...

2015-02-12 19:06:27

阅读数:17442

评论数:8

GSP序列模式分析算法

参考资料:http://blog.csdn.net/zone_programming/article/details/42032309 更多数据挖掘代码:https://github.com/linyiqun/DataMiningAlgorithm 介绍 GSP算法是序列模式挖掘算法的一种,他是...

2015-02-10 09:12:01

阅读数:8177

评论数:0

AdaBoost装袋提升算法

参开资料:http://blog.csdn.net/haidao2009/article/details/7514787 更多挖掘算法:https://github.com/linyiqun/DataMiningAlgorithm 介绍 在介绍AdaBoost算法之前,需要了解一个类似的算法...

2015-02-08 09:22:10

阅读数:8969

评论数:1

分布式系统阅读笔记(二十二)-----时钟和时钟同步

时钟的基本概念 时钟 时钟在一般意义上指的是一个计算机的物理时间,每个计算机都会包括他们自己的物理时钟,不同的计算机的物理可能会不同。 时钟漂移 经过在同个地方的计算机,他们的物理也有可能会不一样,如果他们从刚刚开始相同的时间计时开始,过了1过月,1年也可能会有快又慢,这在专业名词上讲叫做时间漂移...

2015-02-06 15:10:51

阅读数:6892

评论数:1

BIRCH算法---使用聚类特征树的多阶段算法

更多数据挖掘代码:https://github.com/linyiqun/DataMiningAlgorithm 介绍 BIRCH算法本身上属于一种聚类算法,不过他克服了一些K-Means算法的缺点,比如说这个k的确定,因为这个算法事先本身就没有设定有多少个聚类。他是通过CF-Tree,(Clus...

2015-02-05 18:58:27

阅读数:8327

评论数:0

K-Means聚类算法

更多数据挖掘算法:https://github.com/linyiqun/DataMiningAlgorithm 算法介绍 K-Means又名为K均值算法,他是一个聚类算法,这里的K就是聚簇中心的个数,代表数据中存在多少数据簇。K-Means在聚类算法中算是非常简单的一个算法了。有点类似于KN...

2015-02-01 18:26:15

阅读数:6049

评论数:0

提示
确定要删除当前文章?
取消 删除