零基础入门CV赛事- 街景字符编码识别
charie411
这个作者很懒,什么都没留下…
展开
-
街景字符识别5-提高模型精度
前面做了模型训练与验证,我们会发现,模型在训练集、测试集的准确性并不一致,主要是因为存在泛化误差。在机器学习中通常采用k折交叉验证来选择降低泛化误差性能最优模型,但由于训练数据量大,深度学习模型一般需要较长的训练周期。如果硬件设备性能较差不现实,可采用留出法验证模型性能,直至留出的验证集上损失不再变化即停止训练。深度学习中常用于应对过拟合问题的方法:权重衰减和丢弃法(dropout)1 权重衰减1.1 基本内容权重衰减即L2范数正则化,是在损失函数基础上加入权重参数平方和,以惩罚绝对值较大的权重参原创 2020-06-02 14:14:45 · 487 阅读 · 0 评论 -
街景字符识别4-模型训练与验证
模型训练Training the model is an iterative process of finding the “best” parameters to minimize the error损失函数优化算法使用优化算法试图使损失函数最小化。优化算法的目标函数是一个基于训练数据集的损失函数,优化目标在于降低训练误差。梯度下降和随机梯度下降、 小批量随机梯度下降。Gradient Descent is one of the most common algorithms to find th原创 2020-05-30 17:17:20 · 555 阅读 · 0 评论 -
街景字符识别3-字符模型识别
在前面的章节里,我们将街景字符识别问题定位成定长字符多分类问题,即针对各个字符训练分类器,进而进行字符串的识别。1 学习目标学习CNN基础和原理了解迁移学习之微调(Fine Tuning)使用Pytorch框架构建CNN模型,并完成训练2 卷积神经网络(CNN)入门资料推荐:卷积神经网络入门见《机器学习_ 学习笔记 (all in one)_V0.96.pdf》。如果文字还是觉得抽象,那这个资源可视化形式解释卷积神经网络的每一个流程CNN Explainer:比如1个卷积核怎么讲RGB原创 2020-05-26 19:09:42 · 1043 阅读 · 0 评论 -
街景字符识别2-图像读取及图像增广
1 目的PIL读取数据PIL+Torch生成小批量图像数据样本理解Baseline中torchvision.transforms进行图像增广的基本使用方法。2 图像读取Python中完成数据读取操作,比较常用的是Pillow和OpenCV、。注意:Image.open()读取的通道顺序是RGB,cv2.imread()读取的通道顺序为BGR。单一图像读取:2.1 PillowPillow的官方文档读取及图像增强操作示例图像格式转换.注:模式“RGB”转换为模式“L”以后,像素值为原创 2020-05-23 21:20:00 · 864 阅读 · 1 评论 -
街景字符识别1-街景字符编码SVHN
The Street View House Numbers (SVHN) Dataset是街景字符的数据集。街景字符转录是字符序列识别问题。针对图片序列识别问题传统思路是定位、分割、识别,而Google2014年的论文《Multi-digit Number Recognition from Street View Imagery using Deep Convolutional Neural Networks》提出了基于深度卷积神经网络的方法。问题描述:图片中的字符串序列长度不定但不超过5个字符,可以将原创 2020-05-18 15:34:20 · 2373 阅读 · 0 评论