1.什么是机器学习?
首先,什么是机器学习?机器学习约等于找这样一个函数,使得F( 数据 ) = 预测变量。
比如在语音识别中,输入一段语音,输出文字内容
在图像识别中,输入一张图像,输出图中的对象
在围棋中,输入棋盘数据,输出下一步怎么走,
在对话系统中,输入一句 hi ,输出一句回应,
也就是说,我们可以理解为:
模型 = 算法+数据
常见的算法算法选择方法:
2.模型训练过程
在机器学习的训练过程中,通常是使用一个数据集来训练模型。训练数据通常由多条记录组成,每条记录包含输入数据(特征)和对应的输出标签。训练模型的目标是通过学习数据集中的模式和规律,来建立一个能够对一个新的数据集进行准确预测。
训练过程的一般步骤如下:
①初始化模型参数:首先,需要对模型的参数进行初始化。参数的初始化方式可以根据具体的模型和问题决定。
②前向传播:对于每条训练数据,将输入数据通过模型进行前向传播(即从输入到输出计算过程),得到模型对输入的预测输出。
③计算损失函数:将模型的预测输出与真实的输出标签进行比较,得到一个损失函数(代价函数)的值,用来衡量模型的预测值与真实值之间的差异。
④反向传播:根据损失函数,使用反向传播算法计算损失函数对模型参数的梯度。梯度表示了损失函数关于参数的变化率。
⑤参数更新:利用梯度信息,使用优化算法更新模型参数。
⑥重复步骤2到步骤5:直到达到某个停止条件(如达到最大迭代次数或损失函数达到一定阈值。)
训练模型的过程可以看作实在寻找最优参数的过程。参数主要包括模型参数(训练所得)和超参数(预先设置)。
机器学习一般流程: