1.1监督学习
通过让机器学习大量被标记的样本数据,获得所得模型,并能够通过输入数据而得到与训练结果相匹配的输出值。
1.2无监督学习
根据类别未知(无标记)的样本数据解决识别中的各种问题。
2.1分类
对输入值做出预测,根据数据的根据特征,分析输入数据,判断类别或者预测值。其输出的值为离散的,定性的,所属类别。
2.2回归
对输入值做出预测,根据数据的根据特征,分析输入数据,判断类别或者预测值。其输出的值为连续的,定量的,物体的值。
3.1聚类
通过接受未被标记的数据集,来将不同数据类聚成不同的组。
3.2降维
降低特征的维数,通过降低维数来减少分析时间。
4损失函数
将随机事件或者随机变量的值映射为非负实数来表示随机损失的函数。
5.1训练集
用于训练模型并确定模型的参数。
5.2测试集
用于确定网络结构以及调整模型根据训练经验来设定的参数。
5.3验证集
用于验证模型的泛化能力。
6.1过拟合
模型对于训练数据拟合较好,对新数据和测试数据拟合效果差。
6.2欠拟合
模型对于训练数据,新数据和测试数据拟合效果都差。
7.1经验风险
模型在机器学习过程中在训练数据集上误差的均值。
7.2期望风险
模型在机器学习过程中在所有可能出现的样本上误差的均值。