pytorch验证码识别crnn+ctcloss+beam_search_decoder从0到1（附避坑要点！）

VFAing

已于 2022-08-01 13:48:00 修改

阅读量1.4k

点赞数 2

文章标签： pytorch 人工智能 python rnn cnn

于 2022-07-19 17:51:43 首次发布

本文链接：https://blog.csdn.net/VFAing/article/details/125875123

版权

本文介绍了使用PyTorch进行验证码识别的完整过程，包括数据处理、模型构建、CTC Loss函数的应用及训练细节。通过自定义Dataset加载数据，利用RNN和CNN网络结构，配合nn.CTCLoss进行训练。文中强调了标签编码的注意事项，如保持字符顺序一致，并确保空白字符在第一位。此外，还提到了训练后的模型泛化能力问题，由于数据量小，模型可能无法很好地泛化到新验证码。最后，作者分享了项目代码并推荐了fast_ctc_loss库作为替代方案。

摘要由CSDN通过智能技术生成

数据说明：

网络上分享到的验证码数据，只有1040张图片。

制作dataloader

import os

import cv2 as cv
import torch
from torch.utils.data import Dataset

class CodeDataset(Dataset):

    def __init__(self, path='', transform=None):#, transform=None
        self.path = path
        self.transform = transform
        self.imgs = []
        for root, dirs, files in os.walk(path):
            for file in files:
                self.imgs.append(file)

        self.n_samples = self.imgs.__len__()
        self.labels = [i.split('.')[0] for i in self.imgs]
        unique_set=set(char for label in self.labels for char in label)
        self.map=sorted(list(unique_set))
        self.characters = ['-']+sorted(list(unique_set))
        self.myclass_len=len(self.characters)
        self.char_to_num = dict((c, i) for i, c in enumerate(self.characters))
        self.num_to_char = dict((i, c) for i, c in enumerate(self.characters))


    def __getitem__(self, index):
        img_path = os.path.join(self.path, self.imgs[index])
        to_img = cv.imread(img_path)
        if self.transform:

最低0.47元/天解锁文章

VFAing

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
pytorch验证码识别crnn+ctcloss+beam_search_decoder从0到1（附避坑要点！）

pytorch验证码识别crnn+ctcloss+beam_search_decoder从0到1（附避坑要点！）
复制链接

扫一扫