训练loss不下降

最新推荐文章于 2023-02-07 03:28:31 发布

bingmeishi

最新推荐文章于 2023-02-07 03:28:31 发布

阅读量189

点赞数 1

文章标签：自然语言处理

本文链接：https://blog.csdn.net/bingmeishi/article/details/105159466

版权

1，Embedding初始化不当
为了使句子长度保持一致，在数据预处理时对句子进行了padding，并在Embedding层指定了padding_idx，但是在模型初始化时，错误使用了uniform_进行初始化，造成padding部分embedding输出不为0。这就导致模型将句子padding部分当成句子中的有用信息去学习，训练结果不收敛

emb = nn.Embedding(5,3,padding_idx=0)
print(emb.weight.data)
>>>tensor([[ 0.0000,  0.0000,  0.0000],
           [ 1.8105,  1.2178, -0.2205],
           [-0.3240,  1.5968,  0.4394],
           [ 0.5957,  0.0333,  1.5510],
           [-1.2320,  0.7576, -1.0856]])
# uniform_初始化之后，padding部分都变成非0数值
emb.weight.data.uniform_(-0.1, 0.1)
>>>tensor([[ 0.0468,  0.0842, -0.0063],
           [-0.0537,  0.0975,  0.0155],
           [ 0.0086,  0.0962,  0.0746],
           [-0.0730,  0.0667, -0.0202],
           [-0.0993,  0.0767, -0.0351]])

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

bingmeishi

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
训练loss不下降

1，Embedding初始化不当为了使句子长度保持一致，在数据预处理时对句子进行了padding，并在Embedding层指定了padding_idx，但是在模型初始化时，错误使用了uniform_进行初始化，造成padding部分embedding输出不为0。这就导致模型将句子padding部分当成句子中的有用信息去学习，训练结果不收敛emb = nn.Embedding(5,3,paddi...
复制链接

扫一扫

机器学习中 embedding层原理

dudu3332的博客

02-19

2493

本篇文章主要介绍以下内容：什么是 neural network embedding ？我们为什么需要使用 neural network embedding？以及 embedding 是如何自学习的？本文中，将谈到这样一个例子，使用 neural network embedding 来表示所有维基百科上的书籍，可以通过这里访问到原作者的推荐系统项目。 Figure 1: Neur...

解决Pytorch训练过程中loss不下降的问题

09-18

今天小编就为大家分享一篇解决Pytorch训练过程中loss不下降的问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

参与评论您还未登录，请先登录后发表或查看评论

踩过的坑

春天

09-24

391

目录1. loss不变，learn nothing2. ner任务，预测标签全部为0 1. loss不变，learn nothing 我的模型没有学到任何东西，不是我的模型太垃圾，而是我太垃圾了，在数据预处理阶段没有仔细检查，导致我的输入的embedding全为零。 Input nothing，learn nothing。 ——春天 2. ner任务，预测标签全部为0 也就是没有识别出任何一个实体，模型给所有的词都搭上了“O”的标签。原因可能是输入的embedding矩阵太过稀疏。正在寻找原因。 .

nlp-Embedding

贵有恒何必三更眠五更起最无益只怕一日曝十日寒

02-07

1747

这个成熟的关系，就是embedding层的所有权重参数。端到端的方法是将Embedding层作为神经网络的一部分，在进行BP更新每一层参数的时候同时更新Embedding，这种方法的好处是让Embedding的训练成为一个有监督的方式，可以很好的与最终的目标产生联系，使得Embedding与最终目标处于同一意义空间。比如做召回阶段的深度模型的目标是衡量两个商品之间的相似性，但是CTR做的是预测用户点击商品的概率，初始化一个不相关的 Embedding 会给模型带来更大的负担，更慢地收敛。

embedding技术在推荐系统中的应用

拾遗

02-22

943

embedding的主要作用是将稀疏向量转换成稠密向量。什么是embedding？ embedding 是用一个低维稠密向量表示一个对象。embedding向量能够表达相应对象的某些特征，同时向量之间的距离反映了对象之间的相似性。（我推测是说embedding本身是可以表示对象特征的，） ...

keras做CNN的训练误差loss的下降操作

09-16

在使用Keras构建卷积神经网络（CNN）时，训练误差(loss)的下降是一个关键问题。本篇文章将探讨如何在Keras中优化CNN的训练过程，以降低损失并提高模型性能。首先，针对训练误差(loss)无法下降的问题，可能是由于...

解决keras GAN训练是loss不发生变化,accuracy一直为0.5的问题

09-16

### 解决Keras GAN训练中Loss不发生变化及Accuracy始终为0.5的问题 #### 一、背景介绍在深度学习领域，生成对抗网络（Generative Adversarial Networks, GANs）是一种强大的模型，能够生成高质量的图像、音频和...

记录模型训练时loss值的变化情况

09-16

在训练过程中，loss值的正常变化趋势是逐渐下降并趋于稳定，这表明模型正在逐步学习到数据的规律。但如果出现以下异常情况，可能需要进行问题排查： 1. **Loss值为NaN**：这通常是由于数值运算中的除零错误或者是...

开源mask rcnn分割模型训练loss下降图

04-03

《开源Mask R-CNN分割模型训练Loss下降图详解》在深度学习领域，语义分割是一种重要的任务，它要求模型能够识别图像中的每个像素所属的类别。而在众多语义分割模型中，Mask R-CNN因其在实例分割上的优异表现而备受...

使用预训练Embedding，finetune DSSM模型

ZILLIZ

05-07

1925

Milvus 小编：本文转载自公众号Python 科技园，作者王多鱼。 1. 前言 DSSM模型是点击预估领域的经典召回模型，是由 “用户”端和 “商品”端两个塔式结构组成。“用户”端和 “商品”端两个子塔分别生成最终的 “用户” Embedding 和 “商品” Embedding。在线上应用时，实时生成 “用户” 端的 Embedding（因为用户的行为是动态的），在线从数...

深度学习损失函数不下降的解决方法

lizz2276的博客

08-13

1万+

当我们训练一个神经网络模型的时候，我们经常会遇到这样的一个头疼的问题，那就是，神经网络模型的loss值不下降，以致我们无法训练，或者无法得到一个效果较好的模型。导致训练时loss不下降的原因有很多，而且，更普遍的来说，loss不下降一般分为三种，即：训练集上loss不下降，验证集上loss不下降，和测试集上loss不下降。这里，首先默认各位都能理解过拟合和欠拟合的概念。一，train loss与test loss结果分析【1】 train loss 不断下降，test loss不断下降，说明网络仍在

[深度学习] loss不下降的解决方法

热门推荐

currycode

04-10

14万+

链接：https://blog.ailemon.me/2019/02/26/solution-to-loss-doesnt-drop-in-nn-train/ 当我们训练一个神经网络模型的时候，我们经常会遇到这样的一个头疼的问题，那就是，神经网络模型的loss值不下降，以致我们无法训练，或者无法得到一个效果较好的模型。导致训练时loss不下降的原因有很多，而且，更普遍的来说，loss不下降一...

CRNN训练accurary一直为0是怎么回事

一只特立独行的猴

07-13

1万+

出现这个情况可能有两种原因，一是数据标签错了，二是学习率没设置的原因。我遇到的是第二个原因，已经成功解决。crnn训练时有很多参数需要设置，源码提供了默认值，其中学习率（lr）的默认设为0.01。如果自己训练的话，把lr设置为0.001甚至0.0001，就不会出现loss很大、accurary很低的情况。之前训练时使用默认的lr，训练时accurary为0,。重新设置lr为0.0001，a...

对于loss持续不降，DEBUG

u010848594的博客

06-05

1万+

神经网络具有两大能力：一、学习能力，指在训练集上精度。二、泛化能力，指在测试集上精度。对于一个大型神经网络在一个大数据集上跑，LOSS持续不降，第一步先减小数据量，比方说只在单张图片上跑，使用小epochsize，观察每次LOSS下降情况，此时如果LOSS还是不下降说明网络没有学习能力，应该调整模型，一般是先把网络规模缩小，因为任何一个网络都会有学习能力，然而此时你的网络没有学习能力，则一定是你的...

CRNN详解

bestrivern的博客

11-02

3万+

一.概述常用文字识别算法主要有两个框架： CNN+RNN+CTC(CRNN+CTC) CNN+Seq2Seq+Attention 本文介绍第一种方法。 CRNN是一种卷积循环神经网络结构，用于解决基于图像的序列识别问题，特别是场景文字识别问题。文章认为文字识别是对序列的预测方法，所以采用了对序列预测的RNN网络。通过CNN将图片的特征提取出来后采用...

训练的LOSS一直为0

qq_34661230的博客

03-07

2万+

http://www.cnblogs.com/sddai/p/8526955.html TensorFlow训练神经网络cost一直为0 问题描述这几天在用TensorFlow搭建一个神经网络来做一个binary classifier，搭建一个典型的神经网络的基本思路是：定义神经网络的layers(层)以及初始化每一层的参数然后迭代：前向传播（Forward propagation）计...

Torch 的几个损失函数

qq_16305985的专栏

01-19

3万+

初步了解一下，pytorch里面的损失函数及使用方法。如有不对的地方，欢迎指出。谢谢！1. L1LossInput: X、Y可以是任意形状的输入，X与Y的 shape相同。Output: 标量用途：计算X与Y的差的绝对值， 1/n * (|Xi -Yi|)2. MSELossInput: x, y 任意具有相同shape的tensor。Output: 计算均方差3. CrossEntro...

训练时loss不下降怎么办