Weka学习
文章平均质量分 69
MrRoyLee
这个作者很懒,什么都没留下…
展开
-
Weka学习 Apriori算法if( !m_car)
weka里Apriori算法涉及两篇文章,一篇是《Fast Algorithms for Mining Association Rules in Large Databases》 另外一篇《Integrating Classification and Association Rule Mining》 。在算法里区别体现在 m_car变量是否为真。 这一篇先说if( !m_car) 情况。原创 2013-05-03 22:23:34 · 1178 阅读 · 0 评论 -
Weka学习:LMT--LMT && LMTNode
LMT,没有什么需要讲的,入口函数是public void buildClassifier(Instances data)。里面都是一些初始化,最重要的就是m_tree = new LMTNode(...);m_tree.buildClassifier(filteredData);所以就直入正题,分析LMTNode原创 2013-09-16 10:46:53 · 1532 阅读 · 0 评论 -
Weka学习:LMT--LogisticBase
这篇文章介绍的是LMT的核心 LogisticBase & LMTNode 。LogisticBase 是基类,可以说大部分的LMT核心功能都在这里实现。我们需要一个一个分析。看核心函数之前,先看几个核心数组。 double[][] trainYs = getYs(m_train); double[][] trainFs = getFs(m_numericDa原创 2013-09-09 22:49:03 · 1386 阅读 · 0 评论 -
Weka学习:LMT--ResidualModelSelection & ResidualSplit
学习LMT源代码之前,要先看几个类,包括ResidualModelSelection ,ResidualSplit,LMTNode,,LogisticBase,SimpleLinearRegression,这里先介绍ResidualModelSelectionhe和ResidualSplit。下一篇介绍其余的。这两个类联合起来充当分裂节点的作用。先看ResidualSplit。这个类有四个主要原创 2013-09-09 15:11:36 · 994 阅读 · 0 评论 -
Weka 学习 ID3
ID3算法相对简单,weka的实现也容易理解。首先介绍一下大致算法。算法概述如下。1.选择一种度量(ID3选择的是信息增益),计算每个属性对于该度量的值。2.根据结果选择一个属性进行分支。3.如果每个分支全部属于一个类或者已经没有候选属性。则停止,否则对每个分支进行1,2操作。下面对weka的ID3 class 作介绍,主要涉及到makeTree(Instances data),c原创 2013-08-15 15:52:54 · 1553 阅读 · 0 评论 -
Weka学习 :ADTree
ADTree中主要有两种节点,一种是PreditionNode,一种是SplitNode。weka实现中就对应定义了这两个数据结构。 public class PredictionNode { double value; FastVector children; }value存 a或者b(具体含义请看论文)。children存SplitNode. public abstract原创 2013-08-19 00:06:13 · 2783 阅读 · 0 评论 -
Weka学习 Apriori算法附二 if(m_car)
看完源码,发现weka作者并没有完全实现参考论文二(>)中所阐述的算法。只是实现了一部分,即CBA-RG(Classification Based on Associations -rule generator)过程,并没有实现关键过程CBA-CB(classifier builder)过程,因此自己实现一下。(未完待续)原创 2013-05-08 15:58:14 · 1082 阅读 · 0 评论 -
Weka 学习 Apriori 附一 AprioriTID算法
如果看了《Fast Algorithms for Mining Association Rules in Large Databases》,会发现对于 findLargeItemSets 来说,有两种算法。第一种就是Weka用的 apriori,另外一种叫做AprioriTid.两者殊途同归,最后得到相同的结果。往下深究,会发现其实区别仅仅在对新产生的集合每一项的Support更新上面。我下面简单原创 2013-05-05 00:37:24 · 2842 阅读 · 0 评论 -
Weka 学习:J48(C4.5)
Before writing:To improve my english,I will write my blog in English. Section One: J48 J48 is a class to implement C4.5 algorithm.Look at part of the code.In thebuildClass原创 2013-09-16 22:32:15 · 1213 阅读 · 0 评论