数据清洗,花时间
特征工程
使用模型进行训练
模型参数调优
sklearn所有算法,封装好了
直接用,使用规则如下
clf = DecisionTreeClassifier(criterion=‘entropy’)
clf.fit(X_train,y_train)
y_ = clf.predict(X_test)
from sklearn.metrics import accuracy_score
accuracy_score(y_test,y_)
from sklearn.tree import DecisionTreeClassifier
# 调用画树模式
from sklearn import tree
# filled 节点加颜色,颜色越深熵越小
_ = tree.plot_tree(clf,filled = True,feature_names=feature_names,max_depth=1)
# 保存树图
plt.savefig('./tree.jpg')
---------------------------------------------------------------------------
NameError T