Pytorch深度学习-第4章学习简笔_pytorch做深度学习时,训练集很快达到最优值准确率很快达到100-CSDN博客

本文链接：https://blog.csdn.net/Mrm_cong/article/details/105671285

4.1 三类机器学习

1. 有监督学习:有标签数据的学习（需要得到的学习结果为具体的、可表示的、可描述的）

2. 无监督学习：没有标签数据的学习（对数据进行整理，归类寻找特征）

3. 强化学习

1. 欠拟合：模型在训练中表现不佳，训练准确率无法提高达到要求。

2. 过拟合：模型在训练数据集上表现优秀，但是在未知数据验证集上的表现不佳

解决办法
（1）获取多样、范围更大的数据集（较困难）
（2）缩小网络模型的规模
（3）应用权重正则化：模型的权重过大时，正则化会增加损失值以对网络进行约束
（4）应用dropout层：在网络训练过程中应用dropout层，随机屏蔽一定比例的输出数据，使得模型能够不依赖特定的权重或模型

1. 定义问题并创建数据集：确定所解决问题的类型，是分类问题还是回归问题。确定了解决的问题类型后，需要了解数据中有哪些信息有利于问题的解决，确定好能够成为真实指标的特征（注意，选取过多的相干因素，也可能会使模型难以拟合）。

2. 成功的衡量标准：成功的标准不是简单的准确率。当模型在某类较小比例数据下的实际测试准确率高时，说明模型对于问题的解决很成功。

3. 评估协议：

评估的三种方式:

4. 准备数据：将数据转化为张量格式

5. 模型基线：每个问题都应该有一个基线分数，在设计初始模型时我们应该确保简单模型可以超过这个分数。如果无法超过基线分数，说明输入中可能不包含必要信息。（注：前期不要引入任何正则化条件）

6. 大到过拟合的模型： 当模型能够超过基线分数时，我们就需要尽可能提高模型的数值。一般有如下方法：

在这种情况下，当训练的准确率还在增加但是验证准确率开始停止增加甚至开始下降停止训练时，这就是模型过拟合的地方。此时，我们可以用到前面的正则化技术

7. 应用正则化

8. 学习率的选择： 合适的学习率对与模型寻找问题最优解至关重要。在Pytorch中提供了一些调整学习率的技术，由torch.optim.lr_sheduler包提供