一.填空题
1. 最大边距超平面
2. 铰链,正则化项
3. 核方法
4. 损失函数,分类器参数矩阵的范数
5. 正则化
二.编程题
import numpy as np
from sklearn.svm import SVC
from sklearn.datasets import load_iris
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import GridSearchCV,train_test_split
iris=load_iris()
#step1:将原始数据转化为SVM能识别的数据格式
X=iris.data
y=iris.target
#step2:将数据标准化,此处标准化X
scaler=StandardScaler()
X_std=scaler.fit_transform(X)
#划分数据集为训练集和测试集
X_train,X_test,y_train,y_test=train_test_split(X_std,y,test_size=0.3)
#step3:确定SVM的核函数,缺省使用RBF核
svc=SVC(kernel='rbf',class_weight='balanced')
c_range=np.logspace(1,5,19,base=2)
gamma_range=np.logspace(-7,-3,19,base=2)
#step4:利用交叉验证网格搜索寻找最优参数C和gamma,cv=3,三折交叉
param_grid=[{'kernel':['rbf'],'C':c_range,'gamma':gamma_range}]
grid=GridSearchCV(svc,param_grid,cv=3,n_jobs=-1)
#step5:使用最优参数训练模型
clf=grid.fit(X_train,y_train)
print(grid.best_params_)
#step6:测试,此处计算测试集精度
score=grid.score(X_test,y_test)
print(score)
程序的运行结果: