计算机程序基于给定的、有限的学习数据出发(常基于每条数据样本是独立同分布的假设),选择某个模型方法(即假设要学习的模型属于某个函数的集合,也称为假设空间),通过优化算法更新模型的参数值(经验),以优化处理任务的指标表现,最终学习出较优的模型,并运用模型对数据进行分析与预测以完成任务。由以上,得出机器学习的四要素: 1)数据 即数据样本,样本由描述其各个维度的特征及目标值标签组成(特征和标签) 2)模型 模型(机器学习模型)简单来说就是,学习数据特征和标签的关系或者学习数据特征内部的规律 的一个函数。 模型是一种抽象的数学函数,它可以将输入数据映射到输出数据。 3)学习目标 学习目标:学习(训练、调试)到好的模型--> 极大化降低损失函数为目标 好的模型:预测值和实际值之间的误差尽可能的小 衡量预测值和实际值之间的误差的函数: 损失函数(Loss Function)或者代价函数(Cost Function) 不同的任务目标,往往需要不同的损失函数,如: 回归任务:均方误差损失函数-->所有样本的预测值 减去 实际值 求平方后 的平均值 分类任务:交叉熵损失函数 4)优化算法 有了极大化降低损失函数为目标,第一反应通常是求解损失函数的最小值以获得最优的模型参数。 但是由于机器模型的损失函数通常较为复杂,很难直接求最优解。 因此,可以通过优化算法(如梯度下降算法、牛顿法等)有限次迭代优化模型参数,尽可能降低损失函数的值,获得较优参数
机器学习过程&四要素
最新推荐文章于 2024-03-29 16:51:32 发布