实践方法论（Datawhale X 李宏毅苹果书 AI夏令营）

最新推荐文章于 2024-09-27 10:58:53 发布

weixin_50021146

最新推荐文章于 2024-09-27 10:58:53 发布

阅读量204

点赞数 3

文章标签：人工智能

本文链接：https://blog.csdn.net/weixin_50021146/article/details/141873966

版权

1.看测试数据结果前，先看训练数据有没有做好。没有做好的原因：

1.1模型的灵活性不够

a.可以增加更多特征，

b.可以设一个更大的模型，

c.可以用深度学习

1.2优化做得不好（梯度下降问题）

1.3如何判定是以上哪个原因

1.3.1可以先跑一些比较小的、比较浅的网络，或甚至用一些非深度学习的方法，比如线性模型、支持向量机（Support Vector Machine，SVM），SVM 可能是比较容易做优化的，它们比较不会有优化失败的问题.看得到的损失。

1.3.2只有同样的模型，越做深损失越大，说明优化有问题。

1.3.3训练数据上面的损失小，测试数据上的损失大，可能是真的过拟合

1.4过拟合

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_50021146

关注关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Datawhale X 李宏毅苹果书 AI夏令营进阶班选修笔记

09-03

运行结果

Datawhale X 李宏毅苹果书 AI夏令营入门班选修3

09-03

结果prediction

参与评论您还未登录，请先登录后发表或查看评论

Datawhale X 李宏毅苹果书 AI夏令营task1笔记

scipig_的博客

08-22

987

本章主要介绍深度学习常见的一些概念，方便我们从不同的角度来更好地优化神经网络。

实践方法论-Datawhale X 李宏毅苹果书 AI夏令营

leeee9的博客

09-03

255

模型优化需要在灵活性与过拟合之间取得平衡。通过数据增广、正则化等技术，可以有效地减少过拟合问题，同时，交叉验证和适当的模型复杂度选择也能帮助提升模型的泛化能力。此外，解决不匹配问题还需要关注训练和测试数据的分布差异，并进行相应的调整。

Datawhale X 李宏毅苹果书 AI夏令营：实践方法论

2201_75731519的博客

08-29

758

在应用机器学习算法时，实践方法论可以帮助更好地训练模型。如果在 Kaggle 上的测试结果不佳，应首先检查训练数据的损失情况。如果模型在训练数据上的损失很大，说明它在训练集上没有学好。此时，应分析模型在训练集上未能学好的原因，再进一步优化。

Datawhale X 李宏毅苹果书 AI夏令营 2 实践方法论

Jay_Ruan的博客

09-03

821

过拟合发生在模型过度适应训练数据的细节而忽略了泛化能力时，导致在新的或未见过的数据上表现不佳。数据不匹配是指模型训练时使用的数据分布与实际应用或测试时的数据分布不一致。这种不一致可能导致模型在实际应用中表现不佳，即使在训练集上表现良好。

Datawhale X 李宏毅苹果书 AI夏令营 task3 实践方法论

y620502的博客

09-03

898

在应用机器学习算法时，实践方法论能够帮助我们更好地训练模型。

深度学习(实践方法论)#Datawhale X 李宏毅苹果书 AI夏令营

Rooseveltcdc的博客

09-03

300

解决过拟合的问题有两个可能的方向：增加训练集和给模型一些限制。解决不匹配的问题需要有对数据本身的理解，也可能需要对训练集跟测试集的产生方式有一些理解，这样才能判断它是不是遇到了不匹配的情况。对此，找一个从来没有做过的问题，可以先跑一些比较小的、比较浅的网络，或甚至用一些非深度学习的方法，比如线性模型、，SVM可能是比较容易做优化的，它们比较不会有优化失败的问题如果是模型偏差，就把模型变大。如果是深度学习的话，就给它比较少的神经元的数量，减少神经元的数量，或者让模型共用参数，可以让一些参数有一样的数值。

机器学习基础-实践方法论（Datawhale X 李宏毅苹果书 AI夏令营）

uwpk123的博客

09-03

206

2 机器学习实践方法论 模型偏差模型偏差可能会影响模型训练优化问题增加模型的灵活性线性模型、支持向量机：比较不会有优化失败的问题过拟合增加数据集数据增强：根据问题的理解创造出新的数据早停、正则化、丢弃法交叉验证训练集和验证集不匹配

Datawhale X 李宏毅苹果书 AI夏令营（三）：实践方法论

Joe66693的博客

09-01

285

不匹配跟过拟合其实不同，一般的过拟合可以用搜集更多的数据来克服，但是不匹配是指训练集跟测试集的分布不同，训练集再增加其实也没有帮助了。假设数据在分训练集跟测试集的时候，使用 2020年的数据作为训练集，使用2021年的数据作为测试集，不匹配的问颖可能就很严重。实际上我认为就是使用更多合理或者可能合理的自变量，这样一方面确实增大了模型复杂度，但是也让模型更有可能在多维空间里拟合收敛假设存在的那个曲线。但是该函数的集合太小了，没有包含任何一个函数，可以让损失变低的函数不在模型可以描述的范围内。

Datawhale X 李宏毅苹果书 AI夏令营（深度学习之实践方法论）

MYNAH_Li的博客

09-03

805

模型偏差是指的是，这种差异不是由随机因素引起的，而是所导致的。简单来讲，就是由于初期设定模型，给定的模型计算能力过弱，导致在通过梯度下降法进行优化以得到损失最小的函数过程中，模型表现太差，结果如同想要在大海里面捞针（一个损失低的函数），结果针根本就不在海里。

Datawhale X 李宏毅苹果书 AI夏令营：《深度学习详解》

08-24

Datawhale X 李宏毅苹果书 AI夏令营：《深度学习详解》

Datawhale X 李宏毅苹果书 AI夏令营：TASK2+CNN实践, pytorch，数据增强，可视化

08-26

Datawhale X 李宏毅苹果书 AI夏令营：TASK2+CNN实践, pytorch，数据增强，可视化

[论文精读]AI-Guardian: Defeating Adversarial Attacks using Backdoors

最新发布

m0_52911108的博客

09-27

912

本文提出了AI-Guardian框架，本质是让模型预测结果受到后门控制，而很难被攻击者操纵，从而抵御对抗攻击。在模型训练阶段，AI-Guardian会针对原始训练样本生成一批后门样本（经过后门处理的样本），按标签双射关系为后门样本分配对应标签，实现后门注入；在模型预测阶段，AI-Guardian先对输入数据进行后门处理，然后将其输入到模型，根据模型输出结果、标签双射关系返回对输入数据真实标签的预测结果。

零售业的数字化转型与消费者体验升级

weixin_58820787的博客

09-24

842

在数字化浪潮的推动下，零售业正经历着前所未有的变革。数字化转型不仅为零售商带来了新的商业模式和运营效率的提升，更重要的是，它极大地提升了消费者的购物体验。金智维将探讨零售业如何通过数字化转型，实现线上线下融合、智能推荐、个性化服务等方面的升级，以满足消费者日益增长的需求。

音频3A——初步了解音频3A

山河君的分享博客

09-23

1673

在日常的音视频通话过程中，说话的双端往往会面对比较复杂的场景，比如：环境存在较大的噪声，扬声器需要开启外放导致麦克风重新采集到，麦克风固定而人物需要走来走去等等的场景。而为了面对这些复杂的场景，音频通话不得不引入算法对于声音进行预处理，再进行发送给远端。而3A是对于音视预处理的三种算法的统称。AEC（Acoustic Echo Cancellation）：声学回声消除AGC (Automatic Gain Control)：自动增益控制。

Python精选200Tips：171-175

AnFany

09-26

1119

Python深度学习的项目

【LLM论文日更】| 俄罗斯套娃嵌入模型

qq_59084968的博客

09-22

1258

适应性图像检索也达到了效率和精度的权衡，16维度做粗排，2048维度做精排的准确率已经和直接使用2048维度做排序的精度还高，但计算量大幅减小。：为了提高效率，MRL采用了权重绑定技术，即所有线性分类器的权重相同，从而减少内存成本。每个嵌入的前几个维度是一个信息丰富的低维向量，随着维度的增加，表示逐渐变得粗糙。本文将MRL/MRL-E模型与单独训练的低维表征（FF），SVD分解，子网络[2]方法进行了比较。16-32-64-128-256-2048 对前200-100-50-25-10个样本的。