Datawhale X 李宏毅苹果书 AI夏令营 Task3

最新推荐文章于 2024-09-29 22:27:37 发布

m0_72599446

最新推荐文章于 2024-09-29 22:27:37 发布

阅读量159

点赞数 2

文章标签：人工智能机器学习深度学习

本文链接：https://blog.csdn.net/m0_72599446/article/details/141873106

版权

第二章实践方法论

一、损失分析

1、模型偏差

若我们设置的模型对数据匹配不高或者过于简单，可能会出现模型函数集合中的较小损失并不是我们要找的最小损失，如下图。可以通过增加输入特征值来提高模型灵活性。

2、优化问题

优化我们常用梯度下降法，这种方法可能会让我们找见局部最小值，而不是整个函数集合的最小损失。确定这种问题的方法是通过比较不同层次的模型损失，若深层模型损失大于浅层模型则可以判断是该模型优化问题。如下图。

3、过拟合

过拟合意思是只对特定数据有精准分析丧失了对其他数据的准确性，相当于是模型在训练数据上表现出较低的损失，但在测试数据上的损失太大。

解决方法一个是增大训练集，比如用数据增强的方法；另一个是对模型进行限制，比如：给较少的参数或者特征。但本质上都是对模型进行限制。

我们可以发现灵活太小会导致模型偏差，但太大又会导致过拟合，所以我们需要一个刚刚好的模型，如下图。

二、模型选择

我们可以通过将数据分为训练集和验证集。比如通过k折交叉验证法，将数据分为3份分别两两做训练集，重复三次，将所有分组用模型跑一遍选择平均数据最好的模型。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

m0_72599446

关注关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Datawhale X 李宏毅苹果书 AI夏令营task1笔记

scipig_的博客

08-22

987

本章主要介绍深度学习常见的一些概念，方便我们从不同的角度来更好地优化神经网络。

Datawhale X 李宏毅苹果书 AI夏令营 Task2

weixin_52691220的博客

08-28

588

如果是前两天前四天前五天，它的值会跟未来要预测的，隔天的值是成反比的，所以后面接个都是负数。PS. 所以这边每一个式子都代表了一个不同蓝色的函数，求和就是把不同的蓝色的函数相加，，所以在有看过的数据上，在训练数据上，误差值是比较小的，在没有看过的数据上，在2021。到拿来当作预测的结果，也许预测的会更准也说不定，所以我们就要修改一下模型。坡度的起始点设的跟红色函数转折点一样，蓝色函数的斜率设的跟红色函数斜率一样，接下。考虑了比较多的信息，在训练数据上应该要得到更好的、更低的损失。

参与评论您还未登录，请先登录后发表或查看评论

Datawhale X 李宏毅苹果书 AI夏令营（Task2）

mengluohuayexuan的博客

08-27

1196

根据GPU是否可用选择设备类型# 初始化模型，并将其放置在指定的设备上# 定义批量大小# 定义训练轮数# 如果在'patience'轮中没有改进，则提前停止# 对于分类任务，我们使用交叉熵作为性能衡量标准# 初始化优化器，您可以自行调整一些超参数，如学习率。

Datawhale X 李宏毅苹果书 AI夏令营 Task-2

endact_00的博客

08-26

630

上图说明不同的 Loss 函数会影响训练的难易度;左图会一开始就stuck因为梯度很平坦, 右图有很明显的梯度,训练起来更稳定快速.A: 1, 2, 3 数字潜在也表达了他们之间的关系, 1和2 比较接近, 1和3 相差大, 这不能表达类别之间独立的关系;在梯度很小变化的方向上, 平方根越来越小, 导致更新突然爆炸, 跑到梯度变化大的地方, 然后又慢慢恢复到正轨上;Q: 当把模型输出的标量scaler(1, 2, 3) 当作类别处理可以吗?考虑到随着训练时间变长, 梯度总会慢慢变小, 因此可以。

Datawhale X李宏毅苹果书 AI夏令营Task3

2301_79766496的博客

09-03

782

它的滤波器的大小是 5 × 5，然后有 k = 192 个滤波器，k 的值是试出来的，它也试了128、256，发现 192 的效果最好。核大小都是 3 × 3，一样是 k 个滤波器，也就是每一层都是 192 个滤波器，步幅一样设 1，这样叠了很多层以后，因为是一个分类的问题，最后加上了一个 softmax，没有用汇聚，所以这是一个很好的设计类神经网络的例子。假设图像里面的物体都是比较小的，当卷积神经网络在某种大小的图像上面学会做图像识别，但物体放大，它的性能就会降低不少，卷积神经网络并没有想像的那么强。

Datawhale X 李宏毅苹果书 AI夏令营 task3

2301_79692712的博客

09-03

719

如下图，全连接网络是弹性最大的。全连接网络可以觉得它看整张图像还是只看一个范围，如果它只想看一个范围，可以把很多权重设成0。全连接层可以自己决定看整张图像还是一个小范围。但加上感受野后，只能看一个小范围，网络弹性变小。参数共享又进一步限制了网络的弹性。而感受野加上参数共享就是卷积层。用到卷积层的网络就叫卷积神经网络。卷积神经网路的偏差比较大，因此比较不用一过拟合。下面从另一角度说明卷积神经网络。接下来通过另一途径解释卷积神经网络。如上图，卷积层中有很多滤波器。如果图像时彩色的，他有RGB三个通道。

Datawhale X 李宏毅苹果书AI夏令营 task3

L1951381654的博客

09-03

668

（Activation Layer）：卷积层输出的特征图通常通过一个非线性激活函数进行处理，如 ReLU（Rectified Linear Unit）。（Pooling Layer）：用于对特征图进行降采样，减少特征图的尺寸，保留重要特征。对于图像，输入通常是一个三维矩阵（高度 x 宽度 x 通道数，如 RGB 图像有三个通道）。（Output Layer）：最后一层通常使用 Softmax /Sigmoid 函数，将全连接层的输出转换为类概率分布或回归结果。，负责提取数据的局部特征。之后，激活函数之前。

Datawhale X 李宏毅苹果书 AI夏令营入门班Task2

wtby1234的博客

08-28

418

HardSigmoid 可以看作是两个修正线性单元（Rectified Linear Unit，ReLU）的加总，ReLU 的图像有一个水平的线，走到某个地方有一个转折的点，变成一个斜坡，此外，我们可以不只用一个特征 x1，可以用多个特征代入不同的 c, b, w，组合出各种不同的函数，从而得到更有灵活性（flexibility）的函数。输入的特征 x 乘上一个权重，再加上一个偏置就得到预测的结果，这样的模型称为线性模型（linear model）。2. 可以用Sigmoid 函数逼近这一个蓝色的函数。

Datawhale X 李宏毅苹果书 AI夏令营task3

qq_45801244的博客

09-03

332

如果随机分验证集，可能会分得不好，分到很奇怪的验证集，会导致结果很差，如果有这个担心的话，可以用 k 折交叉验证（k-foldcross validation），如图 2.11 所示。不匹配跟过拟合不同，一般的过拟合可以用搜集更多的数据来克服，但是不匹配是指训练集跟测试集的分布不同，训练集再增加其实也没有帮助了，所以这种问题要怎么解决，匹不匹配要看对数据本身的理解了,我们可能要对训练集跟测试集的产生方式有一些理解，才能判断它是不是遇到了不匹配的情况。模型太复杂的就过拟合，选太简单的有模型偏差的问题。

Datawhale X 李宏毅苹果书 AI夏令营：TASK2+CNN实践, pytorch，数据增强，可视化

08-26

Datawhale X 李宏毅苹果书 AI夏令营：TASK2+CNN实践, pytorch，数据增强，可视化

Datawhale X 李宏毅苹果书 AI夏令营入门班选修3

09-03

结果prediction

Datawhale X 李宏毅苹果书 AI夏令营进阶班选修笔记

09-03

运行结果

Datawhale X 李宏毅苹果书 AI夏令营：《深度学习详解》

08-24

Datawhale X 李宏毅苹果书 AI夏令营：《深度学习详解》

扩散模型（2）--1

最新发布

m0_63860007的博客

09-29

469

生成模型通过学习并建模输入数据的分布，从而采集生成新的样木，该模型广泛运用于图片视频生成、文本生成和药物分子生成。扩散模型是一类概率生成模型，扩散模型通过向数据中逐步。

[论文精读]AI-Guardian: Defeating Adversarial Attacks using Backdoors

m0_52911108的博客

09-27

925

本文提出了AI-Guardian框架，本质是让模型预测结果受到后门控制，而很难被攻击者操纵，从而抵御对抗攻击。在模型训练阶段，AI-Guardian会针对原始训练样本生成一批后门样本（经过后门处理的样本），按标签双射关系为后门样本分配对应标签，实现后门注入；在模型预测阶段，AI-Guardian先对输入数据进行后门处理，然后将其输入到模型，根据模型输出结果、标签双射关系返回对输入数据真实标签的预测结果。

零售业的数字化转型与消费者体验升级

weixin_58820787的博客

09-24

850

在数字化浪潮的推动下，零售业正经历着前所未有的变革。数字化转型不仅为零售商带来了新的商业模式和运营效率的提升，更重要的是，它极大地提升了消费者的购物体验。金智维将探讨零售业如何通过数字化转型，实现线上线下融合、智能推荐、个性化服务等方面的升级，以满足消费者日益增长的需求。

Python精选200Tips：171-175

AnFany

09-26

1122

Python深度学习的项目

神经网络在多分类问题中的应用

小高~的博客

09-29

490

神经网络在分类任务中的应用越来越广泛，尤其是在图像识别、自然语言处理等领域。本文将介绍如何使用PyTorch构建一个简单的神经网络来处理多分类问题。我们将通过一个实战案例，展示数据构造、模型训练、模型保存与加载、以及评估结果的整个过程。

李宏毅深度学习速成：入门必备教程

深度学习指南由李宏毅在2018年推出，是一份针对初学者极其友好的教育资源，帮助读者快速理解和掌握深度学习...对于希望踏入人工智能领域的专业人士和学生而言，李宏毅的《一天搞懂深度学习》无疑是一个宝贵的学习起点。