关于pytorch自带的CTCloss使用时的注意事项

最新推荐文章于 2024-06-04 15:32:20 发布

CaiDou_

最新推荐文章于 2024-06-04 15:32:20 发布

阅读量1.2k

点赞数

分类专栏：模型框架学习文章标签： pytorch 神经网络

本文链接：https://blog.csdn.net/qq_36276587/article/details/117416054

版权

模型框架学习专栏收录该内容

13 篇文章

订阅专栏

本文讲述了在从百度CTC Loss切换到PyTorch自带的CTC Loss时遇到的问题，主要集中在log_softmax操作的差异。解决办法是在网络输出层添加.log_softmax，以确保正确处理概率分布。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

涉及到语音项目或者CRNN的LSTM等训练时，通常会用到CTCLoss，在使用低版本的pytorch的时候，一种用的是百度CTCloss，由于换了3090的卡，pytorch也强行升级到1.8版本，没办法和百度CTC兼容了，换回自带的from torch.nn import CTCLoss，

发现训练很久都没有预测内容。原来和百度CTC不同的是，pytorch自带的CTCloss的输入要经过log_softmax才可以。在训练时候网络的输出层加上

net(image).log_softmax()

问题解决。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

CaiDou_

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
8
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

CTCloss详解

yang_daxia的博客

05-27

7467

1.映射规则: 案例: 2. ctcloss 计算所有可以映射为输出路径的概率总和:枚举方法计算量太大, 所以采用DP: 一共三种情况: 1. PPT: https://docs.google.com/presentation/d/12gYcPft9_4cxk2AD6Z6ZlJNa3wvZCW1ms31nhq51vMk/pub?start=false&loop...

CTCLoss 学习笔记

jacke121的专栏

12-18

2020

CTCLoss 以下转自：如何优雅的使用pytorch内置torch.nn.CTCLoss的方法 - 知乎二、CTCLoss接口使用说明第一步，获取CTCLoss()对象 ctc_loss = nn.CTCLoss(blank=len(CHARS)-1, reduction='mean') 类初始化参数说明： blank：空白标签所在的label值，默认为0，需要根据实际的标签定义进行设定； reduction：处理output losses的方式，string类型，可选'none'

8 条评论您还未登录，请先登录后发表或查看评论

中文Chinese-CRNN代码训练中遇到loss nan的问题解决方法

ROYOLE'S

10-26

945

首先通过以下代码，对问题进行定位 with torch.autograd.detect_anomaly(): loss.backward() 然后，发现问题出在损失函数上面了： RuntimeError: Function 'CtcLossBackward' returned nan values in its 0th output. 检查CTC Loss的参数设置，由于我没有修改原始config中图像初始长宽，而我自己使用的数据集label都比较长，这导致CTC Loss中length比

Python-PyTorchCTC是CTCConnectionistTemporalClassification的PyTorch实现

08-11

PyTorch-CTC是CTC (Connectionist Temporal Classification) 的PyTorch实现。 C 代码从TensorFlow中大量借用，并进行了一些改进以提高灵活性。

pytorch内置torch.nn.CTCLoss

Maisie_Nan的博客

04-23

2984

一、开篇简述 CTC 的全称是Connectionist Temporal Classification，中文名称是“连接时序分类”，这个方法主要是解决神经网络label 和output 不对齐的问题（Alignment problem），其优点是不用强制对齐标签且标签可变长，仅需输入序列和监督标签序列即可进行训练，目前，该方法主要应用于场景文本识别（scene text recognition...

Pytorch的ctc解码实现

qq_37950002的博客

11-02

2386

在github上看到一个很好的ctc解码实现，暂时还没用。附上链接： pytorch的ctc解码实现作者在readme里对代码的参数的介绍的很清楚，就不搬运翻译了，可以直接看。在pytorch上CTC的安装: pytorch上CTC安装 ...

pytorch0.4安装ctc_loss

怡宝2号

04-29

1024

前言： pytorch0.4.1的安装可以参考我的另外一篇博客pytorch0.4.1安装CTC loss pytorch1.0后框架自带有ctc损失函数安装流程克隆项目，在根目录下新建build文件夹 git clone https://github.com/SeanNaren/warp-ctc.git cd warp-ctc mkdir build; cd build cmake .....

CTC模型、安装及其pytorch绑定安装

大数据挖掘SparkExpert的博客

07-25

2197

CTC模型是语音识别模型中常见的模块之一，现有主流的语音识别系统经常采用该模型来实现端到端的语音识别。而CTC出现之前，语音识别模型的端到端识别效果还是相对较弱的，也就是说CTC解决了这一问题。 1、CTC的相关原理深度学习的序列到序列模型可以解决许多现实任务，如： Image Classification Image Generation Language Modeling Sen...

记录使用pytorch训练crnn

最新发布

猫猫与橙子的博客

06-04

568

记录使用pytorch训练crnn

PyTorch框架

zhaohui blog

04-13

1679

整理深度之眼 pytorch训练营笔记

Pytoch CTC

loopun的博客

10-21

364

背景关于CTC 原理的介绍可参考 Sequence Modeling With CTC. 主要采用动态规划算法实现 Issue GitHub issue 目前比较广泛使用的CTC 有两个，一个是百度实现的wrap ctc, 另一个则是由pytorch 实现。对于百度实现的CTC(在pytorch 1.1.0下编译), 在我的实验中，使用Synth90K 训练，在IIIT5K上只能达到64%左...

ctcdecode:PyTorch CTC解码器绑定

04-28

ctc解码 ctcdecode是针对PyTorch的CTC（连接器时间分类）波束搜索解码的实现。从Paddle 借用的C ++代码。它包括支持标准波束搜索的可交换评分器支持，以及基于KenLM的解码。如果您不熟悉CTC和Beam搜索的概念，请访问参考资料部分，我们在其中链接了一些教程，解释了为什么需要它们。安装该库基本上是独立的，只需要PyTorch。构建C ++库需要使用gcc或clang。还可以选择包含KenLM语言建模支持，并且默认情况下启用该功能。以下安装也适用于Google Colab。 # get the code git clone --recursive https://github.com/parlance/ctcdecode.git cd ctcdecode && pip install . 如何使用 from ctcdecode import CT

pytorch CTCLOSS 降不下來的bug

u012483097的博客

05-26

2150

ctc_loss = nn.CTCLoss() log_probs = torch.randn(50, 16, 20).log_softmax(2) targets = torch.randint(1, 20, (16, 30), dtype=torch.long) input_lengths = torch.full((16,), 50, dtype=torch.long) target_lengths = torch.randint(10,30,(16,), dtype=torch.long) los.

Pytorch中的CTC loss

fidbdiej的博客

05-05

2657

Pytorch中的CTC loss pytorch中已经内置了ctc loss，可以非常方便的进行使用。主要就是两个API，一个是创建ctc loss；一个是计算ctc loss。创建ctc loss的api ctc_loss = nn.CTCLoss(blank=len(CHARS)-1, reduction='mean') # blank：表示空白符blank的序号。刚才我们在举例的时候说过，CTC增加了一个blank的符号。此处传入的就是空白符的序号。例如我们的预测文本中如果只包含26个英文字母，其

CTC束搜索解码原理和Pytorch实现（CTC Prefix BeamSearch Decode)

lujian45的博客

10-12

1893

CTC非贪婪序列解码算法，CTC束搜索算法。

CTC-Loss

关于我的学习记录

05-14

7296

CTC-Loss

CTCloss从理论到训练

justsolow的博客

04-01

7580

CTCloss与Lipnet

CTC Loss

juluwangriyue的博客

03-28

1093

1、CTC 主要解决的问题 CTC Loss要解决的问题就是当label长度小于模型输出长度时，如何做损失函数。一般做分类时，已有的softmax loss都是模型输出长度和label长度相同且严格对齐，而语音识别或者手写体识别中，无法预知一句话或者一张图应该输出多长的文字，这时做法有两种：seq2seq+attention机制，不限制输出长度，在最后加一个结束符号，让模型自动和gt label对齐；另一种是给定一个模型输出的最大长度，但是这些输出并没有对齐的label怎么办呢，这时就需要CTC lo

OCR-ctcloss详解

pangxing6491的博客

09-13

369

https://zhuanlan.zhihu.com/p/43534801

pytorch CTCloss

07-27

PyTorch中的CTCLoss是指Connectionist Temporal Classification Loss，它是一种用于解决神经网络标签和输出不对齐问题的方法。CTCLoss的优点是不需要强制对齐标签且标签可以是可变长度的。它主要应用于场景文本识别、语音识别和手写字识别等工程场景。在PyTorch 1.0.x版本内，已经内置了CTCLoss接口，可以直接使用。下面是一个使用CTCLoss的代码示例： ```python import torch import torch.nn as nn ctc_loss = nn.CTCLoss() log_probs = torch.randn(50, 16, 20).log_softmax(2).requires_grad_() targets = torch.randint(1, 20, (16, 30), dtype=torch.long) input_lengths = torch.full((16,), 50, dtype=torch.long) target_lengths = torch.randint(10, 30, (16,), dtype=torch.long) loss = ctc_loss(log_probs, targets, input_lengths, target_lengths) loss.backward() ``` 在这个示例中，我们首先创建了一个CTCLoss实例，然后生成了一些随机的log probabilities作为网络的输出。接着，我们生成了一些随机的目标标签和输入长度以及目标长度。最后，我们使用CTCLoss计算了损失，并进行了反向传播。\[2\] 在创建CTCLoss实例时，可以通过设置参数来自定义一些属性。例如，可以使用`blank`参数来指定空白符的序号，`reduction`参数来指定损失的计算方式。\[3\] 希望这个回答对你有帮助！ #### 引用[.reference_title] - *1* [如何使用pytorch内置torch.nn.CTCLoss的方法&&车牌识别应用](https://blog.csdn.net/CSDNwei/article/details/120223026)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [pytorch的torch.nn.CTCLoss方法](https://blog.csdn.net/benben044/article/details/125130411)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down1,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [Pytorch中的CTC loss](https://blog.csdn.net/fidbdiej/article/details/124587812)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]