machine learning
文章平均质量分 73
JamesFen
这个作者很懒,什么都没留下…
展开
-
hadoop学习路线(转)
刚刚入门hadoop,如何去学习hadoop。google一篇学习路线图,与童鞋们共勉:转自:http://blog.csdn.net/zhoudaxia/article/details/8801769-----------------------------------------------------按照这个路线图来学习即可。 1、M. Tim Jones的三篇文章转载 2014-03-30 10:48:56 · 1064 阅读 · 0 评论 -
java实现fp-growth算法
FP Growth算法利用了巧妙的数据结构,大大降低了Aproir挖掘算法的代价,他不需要不断得生成候选项目队列和不断得扫描整个数据库进行比对。为了达到这样的效果,它采用了一种简洁的数据结构,叫做frequent-pattern tree(频繁模式树)。原创 2014-06-17 00:12:52 · 9197 阅读 · 3 评论 -
k-means聚类JAVA实例
k-means聚类JAVA实例,《mahout in action》第六章。原创 2014-05-30 12:50:12 · 3473 阅读 · 1 评论 -
Canopy聚类算法(经典,看图就明白)
只有这个算法思想比较对,其他 的都没有一开始的remove: 原网址:http://www.shahuwang.com/?p=1021 Canopy Clustering 这个算法是2000年提出来的,此后与Hadoop配合,已经成为一个比较流行的算法了。确切的说,这个算法获得的并不是最终结果,它是为其他算法服务的,比如k-means算法。它能有效地降低k-means算法中计算点之间距离的转载 2014-05-27 22:51:45 · 8082 阅读 · 0 评论 -
朴素贝叶斯算法分析及java 实现
采用是否打球的例子对朴素贝叶斯进行分析及java实现原创 2014-06-27 17:17:53 · 5645 阅读 · 3 评论 -
随机森林(Random Forest)
随机森林(Random Forest)随机森林是一个最近比较火的算法,它有很多的优点:在数据集上表现良好在当前的很多数据集上,相对其他算法有着很大的优势它能够处理很高维度(feature很多)的数据,并且不用做特征选择在训练完后,它能够给出哪些feature比较重要在创建随机森林的时候,对generlization error使用的是无偏估计训练速度快在训练过程中,能够检测到fea转载 2014-06-25 22:52:21 · 2922 阅读 · 0 评论 -
Frequent Pattern 挖掘之二(FP Growth算法)
FP树构造FP Growth算法利用了巧妙的数据结构,大大降低了Aproir挖掘算法的代价,他不需要不断得生成候选项目队列和不断得扫描整个数据库进行比对。为了达到这样的效果,它采用了一种简洁的数据结构,叫做frequent-pattern tree(频繁模式树)。下面就详细谈谈如何构造这个树,举例是最好的方法。请看下面这个例子:这张表描述了一张商品交易清单,abcd转载 2014-06-05 16:04:28 · 1071 阅读 · 0 评论 -
决策树算法原理及JAVA实现(ID3)
ID3 决策树的目的在于构造一颗树。如何构造呢?原创 2014-06-21 21:48:31 · 11413 阅读 · 4 评论 -
RStudio 断点调试 进入for循环语句调试
http://www.rstudio.com/ide/docs/debugging/overview原创 2014-05-18 23:22:39 · 22013 阅读 · 1 评论 -
安装python Matplotlib 库
转:使用 python Matplotlib 库 绘图 及 相关问题 使用 python Matplotlib 库绘图 转:http://blog.csdn.net/daniel_ustc/article/details/9714163Matplotlib的安装matplotlib 是python最著名的绘图库,它提供了一整套和matlab相转载 2014-05-18 13:21:17 · 1720 阅读 · 0 评论 -
win7 32位安装 python 及Numpy、scipy、matplotlib函数包
1,python下载安装原创 2014-05-18 11:34:53 · 5037 阅读 · 0 评论 -
我对PageRank的理解及R语言实现
本文参考了以下文章:http://blog.fens.me/algorithm-pagerank-r/原创 2014-05-10 18:24:11 · 4377 阅读 · 0 评论 -
基于MapReduce的矩阵乘法
文字未得及得总结原创 2014-04-08 02:29:09 · 1159 阅读 · 0 评论 -
基本矩阵运算的Java实现
基本矩阵运算的Java实现分类: 图像处理2012-09-18 10:36 2537人阅读 评论(3) 收藏 举报javamatrixparametersstringclassnull一: 矩阵的加法与减法规则:矩阵的加法与减法要求两个矩阵的行列完全相等,方可以完成两个矩阵的之间的运算。举例说明如下二:矩阵的乘法规则:矩阵的乘法要求两个矩阵符转载 2014-04-07 15:00:41 · 2238 阅读 · 1 评论 -
[推荐算法]基于用户的协同过滤算法
(转)[推荐算法]基于用户的协同过滤算法分类: 算法2013-11-12 14:12 1695人阅读 评论(1) 收藏 举报算法python协同过滤算法推荐算法目录(?)[+]什么是推荐算法推荐算法最早在1992年就提出来了,但是火起来实际上是最近这些年的事情,因为互联网的爆发,有了更大的数据量可以供我们使用,推荐算法转载 2014-03-25 23:17:53 · 1693 阅读 · 0 评论 -
数据挖掘中所需的概率论与数理统计知识、上
转 http://blog.csdn.net/v_july_v/article/details/8308762分类: 30.Machine L&Data Mining2012-12-17 19:24 56461人阅读 评论(94) 收藏 举报目录(?)[-]数据挖掘中所需的概率论与数理统计知识上前言第一节微积分的基本概念极限数列的转载 2014-04-01 15:10:43 · 1778 阅读 · 0 评论 -
k阶原点距和k阶中心距各是说明什么数字特征
k阶原点距和k阶中心距各是说明什么数字特征二阶中心距,也叫作方差,它告诉我们一个随机变量在它均值附近波动的大小,方差越大,波动性越大。方差也相当于机械运动中以重心为转轴的转动惯量。(The moment of inertia.) 三阶中心距告诉我们一个随机密度函数向左或向右偏斜的程度。在均值不为零的情况下,原点距只有纯数学意义。A1,一阶矩就是 E(X),即样本均值。具体说转载 2015-06-02 11:51:20 · 13248 阅读 · 0 评论