支持向量机分类器(I)
定义:根据训练样本的分布,搜索可能的线性分类器中最优的分类器。
决策关键:空间间隔最小的两个不同类数据点——“支持向量”
代码:使用支持向量机进行识别:
#从sklearn.preprocessing导入数据便准化模块
from sklearn.prececssing import StandardScaler
#从sklearn.svm里导入基于线性假设的支持向量机分类器LinearSVC
from sklearn.svm import LinearSVC
#对仍需要训练和测试的特征数据进行标准化
ss=StandardScaler()
X_train=ss.fit_transform(X_train)
X_test=ss.transform(X_test)
#初始化线性假设的支持向量机分类器LinearSVC
lsvc=LinearSVC()
#进行模型训练
lsvc.fit(X_train,y_train)
#利用训练好的模型对测试样本进行测试,结果储存在y_predict
y_predict=lsvc.predict(x_test)
利弊:
- 利:适合海量高纬度数据的预测样本筛选(少量且高效)——节约数据内存;提高模型性能
- 弊:计算代价——CPU资源和计算时间