版本matlab2015a
背景介绍:
基于机器学习的分类算法,包括有SVM、决策树、线性回归等监督算法。通过输入特征值和真实响应,训练数学分类模型,matlab提供图形化可视界面,方便进行分类方法的选择以及数据预测。
启动:
首先将训练模型import到workspace空间内,其中CreditRating为训练样本。
在命令窗口内输入classificationLearner,打开窗口。
模型训练:
第一步,确定你的数据格式,这里导入的数据是一个矩阵,既有样本输入也有对应的输出。
第二步确定样本输出为response,其余为predictor。
第三步,是否需要验证,一般都选择交叉验证“Cross Validation”,folds表示几次,自己选择即可。
完成后点击Import Data。
界面上只能显示基于两个特征的散点分布,可以自己改变不同的特征输入(通过X axis和Y axis)。
在界面上有不同的模型,点击模型选择训练,通过自身的交叉验证,可以得出训练模型的正确率。
可以通过ROC曲线观察在不同特征向量下正确分割样本的概率。
模型训练完成,右上角的Expert model可以选择不同方式将模型保存,用作新的样本的分类预测。
样本预测
模型导出到workespace中,命令窗口会显示一下提示信息
这里的T应该值得是一个类,需要自己定义,如果不需要立即保存,可以用另外一种方式进行样本分类预测。
[LABEL,SCORE]=predict(SVM,X)
X是大小为N*P的数字矩阵,其中P是用于训练此模型的预测变量的数量。SCORE代表各个样本的各个特征对此分类的权值,LABEL为预测分类。
结束