2013年08月_starstarstone

08月 07月 05月 01月

转载初探数据挖掘中的十大经典算法

以下就是从参加评选的18种候选算法中，最终决选出来的十大经典算法：一、C4.5C4.5，是机器学习算法中的一个分类决策树算法，它是决策树(决策树也就是做决策的节点间的组织方式像一棵树，其实是一个倒树)核心算法ID3的改进算法，所以基本上了解了一半决策树构造方法就能构造它。决策树构造方法其实就是每次选择一个好的特征以及分裂点作为当前节点的分类条件。C4.5相比于ID3改进的地

2013-08-12 11:16:14 673

如果一个人必须去选择在很大范围的情形下性能都好的、同时不需要应用开发者付出很多的努力并且易于被终端用户理解的分类技术的话，那么Brieman, Friedman, Olshen和Stone（1984）提出的分类树方法是一个强有力的竞争者。我们将首先讨论这个分类的过程，然后在后续的节中我们将展示这个过程是如何被用来预测连续的因变量。Brieman等人用来实现这些过程的程序被称为分类和回归树（CART

2013-08-12 11:13:44 919

转载数据挖掘十大经典算法(9) 朴素贝叶斯分类器 Naive Bayes

贝叶斯分类器　　贝叶斯分类器的分类原理是通过某对象的先验概率，利用贝叶斯公式计算出其后验概率，即该对象属于某一类的概率，选择具有最大后验概率的类作为该对象所属的类。目前研究较多的贝叶斯分类器主要有四种，分别是：Naive Bayes、TAN、BAN和GBN。　　贝叶斯网络是一个带有概率注释的有向无环图，图中的每一个结点均表示一个随机变量,图中两结点间若存在着一条弧，则表示这两结点相对

2013-08-12 11:11:36 957

转载数据挖掘十大经典算法(7) AdaBoost

Adaboost是一种迭代算法，其核心思想是针对同一个训练集训练不同的分类器(弱分类器)，然后把这些弱分类器集合起来，构成一个更强的最终分类器 (强分类器)。其算法本身是通过改变数据分布来实现的，它根据每次训练集之中每个样本的分类是否正确，以及上次的总体分类的准确率，来确定每个样本的权值。将修改过权值的新数据集送给下层分类器进行训练，最后将每次训练得到的分类器最后融合起来，作为最后的决策分类器。

2013-08-12 11:09:51 661

转载数据挖掘十大经典算法(6) PageRank

PageRank是Google算法的重要内容。2001年9月被授予美国专利，专利人是Google创始人之一拉里·佩奇（Larry Page）。因此，PageRank里的page不是指网页，而是指佩奇，即这个等级方法是以佩奇来命名的。　　Google的 PageRank根据网站的外部链接和内部链接的数量和质量俩衡量网站的价值。PageRank背后的概念是，每个到页面的链接都是对该页面的一次投

2013-08-12 11:09:06 705

转载数据挖掘十大经典算法(5) 最大期望(EM)算法

在统计计算中，最大期望（EM，Expectation–Maximization）算法是在概率（probabilistic）模型中寻找参数最大似然估计的算法，其中概率模型依赖于无法观测的隐藏变量（Latent Variabl）。最大期望经常用在机器学习和计算机视觉的数据集聚（Data Clustering）领域。最大期望算法经过两个步骤交替进行计算，第一步是计算期望（E），也就是将隐藏变量象能够观测

2013-08-12 11:07:39 856

转载数据挖掘十大经典算法(4) The Apriori algorithm

Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里，所有支持度大于最小支持度的项集称为频繁项集，简称频集。 Apriori演算法所使用的前置统计量包括了：最大规则物件数：规则中物件组所包含的最大物件数量最小支援：规则中物件或是物件组必顸符合的最低案例数最小信心水准：计

2013-08-12 11:06:45 896

转载数据挖掘十大经典算法(3) Support vector machines

支持向量机，英文为Support Vector Machine，简称SV机（论文中一般简称SVM）。它是一种監督式學習的方法，它广泛的应用于统计分类以及回归分析中。支持向量机属于一般化线性分类器.他们也可以认为是提克洛夫规范化（Tikhonov Regularization）方法的一个特例.这族分类器的特点是他们能够同时最小化经验误差与最大化几何边缘区.因此支持向量机也被称为最大边缘区分类

2013-08-12 11:05:08 722

转载数据挖掘十大经典算法(2) The k-means algorithm

k-means algorithm算法是一个聚类算法，把n的对象根据他们的属性分为k个分割，k 　　假设有k个群组Si, i=1,2,...,k。μi是群组Si内所有元素xj的重心，或叫中心点。　　k平均聚类发明于1956年，该算法最常见的形式是采用被称为劳埃德算法(Lloyd algorithm)的迭代式改进探索法。劳埃德算法首先把输入点分成k个初始化分组，可以是随机的或者使用一些

2013-08-12 11:03:38 934

转载数据挖掘十大经典算法(1) C4.5

机器学习中，决策树是一个预测模型；他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象，而每个分叉路径则代表的某个可能的属性值，而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出，若欲有复数输出，可以建立独立的决策树以处理不同输出。从数据产生决策树的机器学习技术叫做决策树学习, 通俗说就是决策树。决策树学习也是数据挖掘中一个普通的

2013-08-12 11:02:32 732

libxml2-2.7.6.tar.gz

安装php5所需要的基本支持库,安装方法可参考http://blog.csdn.net/starstarstone/article/details/6894842

2012-08-23

httpd-2.4.2.tar.gz

apache安装文件,安装方法可参考http://blog.csdn.net/starstarstone/article/details/6894842

2012-08-23

php-5.4.6.tar.bz2

php5安装文件,安装方法可参考http://blog.csdn.net/starstarstone/article/details/6894842

2012-08-23

Mastering Perl.pdf

Learning Perl，Intermediate Perl，和Mastering Perl共同组成所谓的Perl入门三部曲

2011-07-19

Intermediate Perl.pdf

Intermediate Perl，俗称羊骆驼书，介绍perl面向对象、模块等高级内容。

2011-07-19

c#版五子棋（人机对弈模式）

最近在学习C＃，写了个五子棋的小游戏，把原代码也传给大家。电脑选择下棋点的主要算法分为两部：1.将每个落子点进行评分（有棋或禁手点评为最低）；2.从第一部中选出5个得分最高的落子点，采用回溯算法求得最佳落子点。(代码中有注释) 希望大家有什么建议或者发现了Bug告诉我啊！我这几天有时间会进一步完善这个小游戏，到时再传上来。

2007-03-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

starstarstone的专栏

转载初探数据挖掘中的十大经典算法

转载数据挖掘十大经典算法(10) CART: 分类与回归树

转载数据挖掘十大经典算法(9) 朴素贝叶斯分类器 Naive Bayes

转载数据挖掘十大经典算法(7) AdaBoost

转载数据挖掘十大经典算法(6) PageRank

转载数据挖掘十大经典算法(5) 最大期望(EM)算法

转载数据挖掘十大经典算法(4) The Apriori algorithm

转载数据挖掘十大经典算法(3) Support vector machines

转载数据挖掘十大经典算法(2) The k-means algorithm

转载数据挖掘十大经典算法(1) C4.5

libxml2-2.7.6.tar.gz

httpd-2.4.2.tar.gz

php-5.4.6.tar.bz2

Mastering Perl.pdf

Intermediate Perl.pdf

c#版五子棋（人机对弈模式）

空空如也