一、决策树
1.函数
from sklearn.tree import DecisionTreeClassifier,export_graphviz
import graphviz
from sklearn.ensemble import RandomForestClassifier
1.1决策树
调参 max_depth
clf_3=DecisionTreeClassifier(max_depth=3)
clf_3.fit(x_train,y_train)
显示,导出决策树
from sklearn.tree import DecisionTreeClassifier,export_graphviz
import graphviz
dot_data=export_graphviz(clf_3,out_file=None, class_names=wine.target_names , feature_names=wine.feature_names[:2],impurity=False,filled=True)
k=graphviz.Source(dot_data)
k.view()
优势不足
1.不用数据预处理
2.容易过拟合
2.随机森林[ RF , GBDT ]
from sklearn.ensemble import RandomForestClassifier
clf_r1=RandomForestClassifier(n_estimators=6,max_features=2,random_state=0)
clf_r1.fit(x_train,y_train)
调参 max_features , n_estimators , n_jobs
优缺点
1.支持并行处理,处理超大数据集时,可以提供良好表现
2.对超高维数据集、稀疏数据集表现不好
3.比线性模型速度慢,消耗内存