学习LMT源代码之前,要先看几个类,包括ResidualModelSelection ,ResidualSplit,LMTNode,,LogisticBase,SimpleLinearRegression,这里先介绍ResidualModelSelectionhe和ResidualSplit。下一篇介绍其余的。
这两个类联合起来充当分裂节点的作用。先看ResidualSplit。这个类有四个主要函数,分别是
void buildClassifier(Instances data, double[][] dataZs, double[][] dataWs) ;
boolean getSplitPoint();
double entropyGain() ;
double entropy(double[][] dataZs, double[][] dataWs);
第一个函数主要是初始化之类的, 里面最重要的就是调用 getSplitPoint(),这里不说。直接说 getSplitPoint();
protected boolean getSplitPoint() throws Exception{
//compute possible split points
double[] splitPoints = new double[m_numInstances];
int numSplitPoints = 0;
Instances sortedData = new Instances(m_data);
sortedData.sort(sortedData.attribute(m_attIndex));
double last, current;
last = sortedData.instance(0).value(m_a