机器学习算法 2

最新推荐文章于 2024-05-21 06:30:00 发布

bylfsj

最新推荐文章于 2024-05-21 06:30:00 发布

阅读量817

点赞数

本文链接：https://blog.csdn.net/bylfsj/article/details/104537139

版权

本文介绍了机器学习中的决策树、随机森林与支持向量机。决策树的优势在于无需数据预处理，但易过拟合。随机森林支持并行处理，适合大规模数据，但对稀疏数据集处理不佳。支持向量机适用于高维数据，但参数调节和预处理要求较高。SVM和LR的主要区别在于损失函数、正则化和数据依赖性等方面。

摘要由CSDN通过智能技术生成

一、决策树

1.函数

from sklearn.tree import DecisionTreeClassifier,export_graphviz

import graphviz

from sklearn.ensemble import RandomForestClassifier

1.1决策树

调参 max_depth

clf_3=DecisionTreeClassifier(max_depth=3)
clf_3.fit(x_train,y_train)

显示，导出决策树

from sklearn.tree import DecisionTreeClassifier,export_graphviz
import graphviz

dot_data=export_graphviz(clf_3,out_file=None,  class_names=wine.target_names , feature_names=wine.feature_names[:2],impurity=False,filled=True)

k=graphviz.Source(dot_data)
k.view()

优势不足

1.不用数据预处理
2.容易过拟合

2.随机森林[ RF , GBDT ]

from sklearn.ensemble import RandomForestClassifier

clf_r1=RandomForestClassifier(n_estimators=6,max_features=2,random_state=0)
clf_r1.fit(x_train,y_train)