机器学习中的监督学习模型的任务重点在于,根据已有经验知识对未知样本的目标/标记进行预测。
主要涉及方法:
分类学习与回归预测
基本框架和流程
1. 首先准备训练数据,可以使文本、图像、音频等
2. 抽取所需要的特征,形成特征向量(Feature Vectors)
3. 把这些特征向量连同对应的标记?目标(Labels) 一并送入学习算法(Machine Learning Algorithm)训练出一个预测模型(Predictive Model)
4. 采用同样的特征抽取方法作用与新测试数据,得到用于测试的向量;
5. 使用预测模型对这些待测试向量进行预测并得到结果(Expected Label)。
分类学习:
分类学习是最常见的监督学习问题,并且其中的经典模型也是最为广泛的被应用。
其中最基础的便是二分类(Binary Classification)问题,即判断是与非,从两个类别中选择一个作为预测结果;还有多类分类(Multiclass Classification)的问题,即 在多余两分类之中选择一个,还有多标签分类(Multi-label Classification)问题。
线性分类器:
模型介绍: 一种假设特征与分类结果存在线性关系的模型。 通过累加计算每个维度的特征与各自权重的乘积来帮助类别决策