本章讨论了线性模型在机器学习中的应用与局限性。线性模型的基本思想是通过对输入特征施加权重,并添加一个偏置项,从而得出预测结果。这种模型虽然简单易懂,但在面对复杂数据时,往往无法捕捉到更深层次的关系。
章节开始介绍了线性模型的应用,通过简单的函数形式y=b+wx来预测数据,比如预测视频的观看次数。尽管在训练数据上,调整后的模型可以达到较低的误差,但当模型应用到新的数据时,误差往往会增加。为了提高模型的预测能力,可以通过增加更多的输入特征,如考虑前几天的数据,而不仅仅是前一天的数据。这一改进在实践中确实能够减少误差,使得模型的预测更为准确
书中讲述了损失函数的重要性。损失函数用于衡量模型的预测值与实际值之间的偏差。为了让模型更好地拟合数据,通常使用梯度下降法来优化模型参数。梯度下降法通过计算损失函数相对于模型参数的导数,来指导参数的调整方向,逐步减少预测误差
线性模型有其天然的限制。线性模型适用于处理线性关系的数据,但当数据中存在非线性关系时,线性模型的表现就显得力不从心。为了解决这一问题,可以使用分段线性模型或引入非线性激活函数,如 ReLU 或 Sigmoid。这些激活函数能够增加模型的复杂性,使其更好地拟合复杂的数据分布
章节最后介绍了如何通过逐步增加特征和复杂性来提高模型的表现,并强调了领域知识在模型改进中的重要作用。通过合理的模型设计和参数调整,即使是简单的线性模型也可以在一定程度上达到令人满意的预测效果