决策树、SVM、LR算法差异

最新推荐文章于 2024-06-21 23:13:02 发布

Q我不设上限

最新推荐文章于 2024-06-21 23:13:02 发布

阅读量173

点赞数

文章标签：决策树算法支持向量机

本文链接：https://blog.csdn.net/qq_41545139/article/details/129972867

版权

本文以葡萄酒数据集为例，探讨归一化对决策树、逻辑回归和支持向量机算法的差异。未归一化的数据导致LR准确率下降、运行时间增加，SVM准确率显著降低。同时，决策树和线性回归显示特征重要性，而逻辑回归和SVM无此参数。

摘要由CSDN通过智能技术生成

以葡萄酒数据集为研究对象，对比归一化对各种算法的影响，分析算法的差异。

# 不同分类算法的差异

import numpy as np
from sklearn.tree import DecisionTreeClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC
from sklearn import datasets
from sklearn.model_selection import train_test_split #导入数据拆分包
from sklearn.preprocessing import StandardScaler #Z-score归一化
import warnings
warnings.filterwarnings('ignore')

1.加载数据

data=datasets.load_wine()
X=data['data']
y=data['target']

#三种算法是否具有特征重要性属性？

2.归一化处理

np.set_printoptions(suppress=True) #科学计数法转为小数点表示
standard=StandardScaler()
X=standard.fit_transform(X) #数据归一化
X

3.1 LR逻辑斯蒂回归模型应用

%%time
score=0
for i in range(100): #100次计算
    X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.2) #数据拆分
    lr=LogisticRegression() #惩罚项可以选1.0和2.0，最大迭代次数max_iter
    lr.fit(X_train,y_train) 
    s=lr.score(X_test,y_test)
    score&