通过sklearn机器学习工具库
代码十分简洁,内有详细步骤和解释。
直接复制,带入数据,进行调用即可出结果,模型参数设置见文末
def SVM(X_train, Y_train, X_test, Y_test):
"""
X_train: 特征训练集
Y_train: 标注训练集
X_test: 特征测试集
Y_test: 标注测试集
"""
# 01.创建模型
from sklearn.svm import SVC
SVM_model = SVC(C=10000)
# 02.训练模型
SVM_model = SVM_model.fit(X_train, Y_train)
# 03.模型预测
Y_pred = SVM_model.predict(X_test)
# 04.模型评价(accuracy_score:准确率;recall_score:召回率; f1_score:F值)
from sklearn.metrics import accuracy_score, recall_score, f1_score
print('ACC:', accuracy_score(Y_test, Y_pred))
print('REC:', recall_score(Y_test, Y_pred))
print('F-Score:', f1_score(Y_test, Y_pred))
# 05.输出模型参数
print('支持向量指数:', SVM_model.support_)
print('支持向量:', SVM_model.support_vectors_)
print('每一类的支持向量数量:', SVM_model.n_support_)
return
模型参数设置:
参数C:惩罚系数(设置的越高,效果越好,但相应的计算时间也会增加)
参数kernel:核函数,可选:'linear'(线性),'poly'(多项式),'rbf','sigmoid','precomputed'等
参数degree:多项式阶数(如果核函数选择'poly',则需要设置该参数)
参数max_iter:最大迭代次数
参数tol:精度
参数decision_function_shape:多分类,可取:'ovo'和'ovr',默认为'ovr'
……更多参数,见官网。
输出参数设置:
support_:支持向量指数
support_vectors_:支持向量
n_support_:每一类的支持向量数量
……更多的模型参数,见官网
这里的模型评价指标选择了:
① accuracy_score:准确率;
② recall_score:召回率;
③ f1_score:F值。
在上面代码中都是针对测试集的效果,也可以对训练集进行预测,然后评价训练集的效果,综合比较,可以看看是否会出现过拟合现象。