[引言]
SVM是支持向量机(Support Vector Machine)的简称。
SVM具有分类功能(SVC,C是Classification(分类)的首字母);
也具有回归功能(SVR,R是Regression(回归)的首字母)。
[问题分析]
在[Python数据挖掘] sklearn-KMeans聚类一文中,实现了对以下数据集的聚类:
YZN,133,108,76
ZHY,96,145,101
WYZ,132,107,60
DHY,100,102,120
CYH,139,99,93
LHY,73,149,81
ZHY,85,148,93
TQP,39,138,85
ZZL,145,112,71
HJC,101,116,118
XZY,99,98,117
每行第一列是学生姓名,第二列是语文成绩,第三列是数学成绩,第四列是英语成绩。
sklearn-KMeans已成功将该数据集聚为3类:
英语较好的DHY, HJC, XZY聚在一起;
语文较好的YZN, WYZ, CYH, ZZL聚在一起;
数学较好的ZHY, LHY, ZHY, TQP聚在一起。
称以上数据集为train.txt,作为训练集。
设定以下数据集为test.txt,作为测试集。
ZYF,101,142,90
WHQ,140,105,93
LZJ,103,112,115
BHJ,99,140,91
FZY,98,111,118
CWH,144,113,77
使用train.txt的聚类结果对SVC分类器进行训练,然后使用训练好的SVC分类器对test.txt进行分类预测,观察SVC的分类效果如何。
改写[Python数据挖掘] sklearn-KMeans聚类中的代码,首先给出训练集聚类过程:
from sklearn.cluster import KMeans
def loadData(filePath):
fr = open(fileP