【深度学习系列】二、模型训练指南

靖淮CAFEBABE

已于 2023-03-18 11:48:50 修改

阅读量251

点赞数

分类专栏： Machine Learning 文章标签：深度学习机器学习人工智能

于 2023-03-18 11:41:52 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42774786/article/details/129634396

版权

Machine Learning 专栏收录该内容

6 篇文章 1 订阅

订阅专栏

General Guide

1.训练机器学习的基本思路

在这里插入图片描述

1）定义函数【选择算法】；

2）定义损失函数【衡量函数输出与真实值之间的距离】；

3）根据损失优化函数的参数【反向传播】

2.模型训练套路

模型训练的过程很难一步到位，往往训好的模型在使用的时候不work，需要对优化模型。优化的思路可以借鉴下面的这个框架：

在这里插入图片描述

1）分析训练集上的loss，如果训练集上的loss就已经很大了，说明在模型训练过程中就出现问题，在测试上很难有很好的结果，一般有两种可能原因：

i）model bias：模型设计比较简单，难以拟合复杂的函数。
在这里插入图片描述

ii）optimization问题：优化过程中出现问题，没有找到最优参数。
在这里插入图片描述

iii）model bias vs optimization：比较简单算法/浅层网络与复杂算法/深层网络在 training data方面的loss，如果深层网络的loss更大，则是optimization问题

2）训练集的loss比较小，但在测试集上的loss很大，那么也有以下两种原因：

i）over fitting问题：
在这里插入图片描述

一个极端的情况如上所示，在训练集上都预测正确，但是显然在测试集不会work。overfitting通常可以通过增加训练样本来解决（或者进行样本扩充Data augmentation），除此之外，一些其他套路也可以用来解决过拟合
在这里插入图片描述

2）样本mismatch：training data和testing data分布不一样

3.cross validation

为什么要用交叉验证：在模型训练中，模型通常在训练数据上表现好，在训练之外的数据上拟合程度差。交叉验证用于评估模型的泛化能力，从而进行模型选择。cross validatioin

N-fold cross validation：使用训练集的1/n进行验证，将模型训练n次，对n次验证集上的误差取平均，选择误差小的模型。

在这里插入图片描述
李宏毅深度学习

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【深度学习系列】二、模型训练指南

深度学习系列，模型训练训练的过程和优化思路
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。