机器学习 day33（误差分析、添加数据、迁移学习）

丿罗小黑

已于 2024-03-26 20:56:54 修改

阅读量343

点赞数 1

分类专栏：机器学习文章标签：机器学习人工智能

于 2023-09-14 15:34:12 首次发布

本文链接：https://blog.csdn.net/u011453680/article/details/132878314

版权

39 篇文章 10 订阅

订阅专栏

本文探讨了通过误差分析改进模型的有效性，尤其是针对人类擅长的问题。文章重点介绍了数据增强、数据合成两种增加数据多样性的方法，以及迁移学习中的监督预训练和微调过程。迁移学习利用预训练模型加速任务，但要求数据类型一致。

摘要由CSDN通过智能技术生成

迁移学习分为两步：首先为监督预训练，即在一个非常大且与任务目标不完全相关数据集上对模型进行预训练，其次为微调，即在监督预训练中获得或初始化大部分参数的基础上，根据任务目标相关的数据集，进一步运行梯度下降或Adam算法，来微调所有权重参数或仅获得(改变)输出层参数
微调有两种方法：一种是仅获得(改变)输出层的参数，适用于任务目标相关的数据集比较小。一种是训练所有权重参数，适用于任务目标相关的数据集稍大
迁移学习的一个好处是，我们可以在网络上下载已经预训练完成的神经网络，省去了我们自己进行监督预训练的步骤
由上图可以看出，神经网络在前几层学会了检测边缘，检测角点，检测曲线等通用基本形状，这对神经网络进行其他图片识别任务很有帮助。
迁移学习的一个限制是，预训练和微调的数据集必须是同一个类型的，即都是图像数据或音频数据或文本数据