提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
监督学习步骤
监督学习是使用已知正确答案的示例来训练网络,每组训练数据有一个明确的标识或结
果。
1.数据集的创建于分类
首先需要对数据集进行标注,所有数据分为训练集和验证集。目标就是在深度神经网络中找到一个函数,用于对数据进行分类或者回归。
2.数据增强
一般数据集不会包含在各种扰动下的信息,数据的好会对于机器学习的预测能力至关重要,因此一般会进行数据增强。
对于图像,常用的数据增强的方法有:
- 旋转
- 平移
- 变换
- 裁剪
- 仿射变换
3.特征工程
一般来说,特征工程包含特征提取和特征选择。但是在深度学习方法大火之后,人们很大一部分不再关注特征工程本身。
因为常用的卷积神经网络CNN本身就是一种特征提取和选择的引擎。
4.构建预测模型和损失
将原始数据映射到特征空间之后,也就意味着我们得到了比较合理的输入,下一步就是构建合适的预测模型得到对相应的输出。
常见的损失函数有交叉熵、均方差等。通过优化的方法不断迭代,使模型从最初始化状态一步一步变化为有预测能力的模型的过程,实际上就是学习的过程。
5.训练
选择合适的模型和超参数进行初始化,其中超参数比如支持向量机中核函数、误差项惩罚权重等。当模型初始化参数设定好后,将制作好的特征数据输入到模型,通过合适的优化方法不断缩小输出与标签之间的差距,当迭代过程到了截止条件,就可以得到训练好的模型。优化方法最常见的就是梯度下降法及其变种,使用梯度下降法的前提是优化目标函数对于模型是可导的。
6.验证和模型选择
训练完训练集的数据之后,需要进行模型性能测试,利用验证集验证模型性能。在此过程中,通常会通过调整和模型相关的各种事物(超参数)来重复步骤2和3,诸如里面有多少个节点,有多少层,使用怎样的激活函数和损失函数,如何在反向传播阶段积极
有效地训练权值等等。
7.测试及应用
当有了一个准确的模型,就可以将该模型部署到你的应用程序中。你可以将预测功能发布为API(Application Programming Interface, 应用程序编程接口)调用,并且你可以从软件中调用该API,从而进行推理并给出相应的结果。
总结
简单介绍了一下监督学习的步骤。监督式学习的常见应用场景如分类问题和回归问题。
常见的有监督机器学习算法包括支持向量机(Support Vector Machine, SVM),朴素贝叶斯(Naive Bayes),逻辑回归(Logistic Regression),K近邻(K-Nearest Neighborhood, KNN),决策树(Decision Tree),随机森林(Random Forest),AdaBoost以及线性判别分析(Linear Discriminant Analysis, LDA)等。深度学习(Deep Learning)也是大多数以监督学习的方式呈现。