一、极限森林
在随机森林的基础上进行升级。不寻找最有区别的阈值,而是为每个候选特征随机绘制阈值,并且这些随机生成的阈值中的最佳阈值作为划分规则。
极限森林 :1、样本抽样随机 2、每棵树分裂条件随机(不是最好的裂分条件)
决策树,进行分裂的时候,根据信息增益最大进行裂分,刻板
交叉验证:
数据简单,普通算法和复杂算法效果一样。数据预处理非常重要。
如何提升准确率:数据的质量,数据的预处理,算法的提升,参数的调整。
二、代码演练
from sklearn.ensemble import ExtraTressClassifier,RandomForsetClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import cross_val_score
from sklearn import datasets
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
X,y = datasets.load_wine(True)
clf = DecisionTreeClassifier(splitter='best'