以葡萄酒数据集为研究对象,对比归一化对各种算法的影响,分析算法的差异。
# 不同分类算法的差异
import numpy as np
from sklearn.tree import DecisionTreeClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.svm import SVC
from sklearn import datasets
from sklearn.model_selection import train_test_split #导入数据拆分包
from sklearn.preprocessing import StandardScaler #Z-score归一化
import warnings
warnings.filterwarnings('ignore')
1.加载数据
data=datasets.load_wine()
X=data['data']
y=data['target']
#三种算法是否具有特征重要性属性?
2.归一化处理
np.set_printoptions(suppress=True) #科学计数法转为小数点表示
standard=StandardScaler()
X=standard.fit_transform(X) #数据归一化
X
3.1 LR逻辑斯蒂回归模型应用
%%time
score=0
for i in range(100): #100次计算
X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.2) #数据拆分
lr=LogisticRegression() #惩罚项可以选1.0和2.0,最大迭代次数max_iter
lr.fit(X_train,y_train)
s=lr.score(X_test,y_test)
score&