什么是机器学习
机器学习,顾名思义,机器具备有学习的能力。具体来讲,机器学习就是让机器具备找一个函数的能力。机器具备找函数的能力以后,它可以做很多事。比如语音识别,机器听一段声音,产生这段声音对应的文字。
机器学习解决的问题是什么
回归(regression):根据已有数据预测未知数据,输出为一个数值(标量)。
分类(classification):顾名思义,需要注意的是分类不止二元分类,也可以有多个选项。
结构化学习(structured learning):产生有结构的物体,比如让机器画一张图,写一篇文章。
机器学习步骤
模型构建:
选择一个具有可调参数的函数形式,这个函数试图捕捉数据的基本模式。
以线性回归为例,我们使用函数
y=b+wx,其中b是截距,w是斜率。
损失函数定义:
损失函数衡量模型预测值与实际值之间的差异,帮助我们评估模型的准确性。
在线性回归中,我们可以使用均方误差
作为损失函数,其中n是数据点的数量,y是实际值。
参数优化:
通过调整模型参数来最小化损失函数,这个过程称为优化。
使用梯度下降法,我们可以:
随机初始化参数w。
计算当前参数下的损失函数梯度,即损失函数对参数的导数。
根据梯度和学习率η更新参数w。
迭代更新:
重复上述优化过程,直到损失函数值降低到一个可接受的最小值。
每次迭代,我们更新参数w,直到模型的预测与实际数据足够接近。
模型评估与调整:
在模型训练完成后,使用测试数据集评估模型的性能,并根据需要调整模型。
通过比较预测值和实际值,我们可以评估模型的准确性,并根据评估结果对模型进行微调。
泛化能力验证:
确保模型在新的、未见过的数据上也能表现良好。
通过在独立的测试集上进行验证,我们可以检查模型是否具有泛化能力,即在新数据上的表现是否与训练数据上的表现一致。