零基础入门CV赛事- 街景字符编码识别
零基础入门打卡
飞翔的河马F
这个作者很懒,什么都没留下…
展开
-
Task05:模型集成
模型集成最直观的理解是用在最后,然后可以稳定的提升正确率大约2个百分点。 因为还没研究到这一步,先打卡,后边补原创 2020-06-02 21:34:36 · 111 阅读 · 0 评论 -
Task04:模型训练与验证
总结 稍微总结一下,task4就把Datawhale给的文档看了,大概了解怎么回事了,然后里边给的两个链接第一个打不开,不知道怎么回事,然后第二个还差一点看完。 觉得自己还是不能完整的自己写一个神经网络出来,对pytorch不太理解,只能改改baseline,调调别人的代码。 最近几天进度也有点慢,相关的论文、模型和开源代码都没怎么看,而且没怎么看懂,要加油了 ...原创 2020-05-30 21:02:07 · 213 阅读 · 1 评论 -
Task3 字符识别模型
搭建一个卷积神经网络cnn CNN是一种层次模型,输入的是原始的像素数据。CNN通过卷积(convolution)、池化(pooling)、非线性激活函数(non-linear activation function)和全连接层(fully connected layer)构成。 在CNN训练的过程中是直接从图像像素到最终的输出,并不涉及到具体的特征提取和构建模型的过程,也不需要人工的参与。 cnn发展 LeNet-5(1998) AlexNet(2012). VGG-16(2014) Inception-原创 2020-05-26 18:20:20 · 119 阅读 · 0 评论 -
Task02:Baseline问题与理解
1、torch.backends.cudnn.deterministic? 将这个 flag 置为True的话,每次返回的卷积算法将是确定的,即默认算法。如果配合上设置 Torch 的随机种子为固定值的话,应该可以保证每次运行网络的时候相同输入的输出是固定的 2、torch.backends.cudnn.benchmark? 这个 GPU 相关的 flag, 设置 torch.backends.cudnn.benchmark=True 将会让程序在开始时花费一点额外时间,为整个网络的每个卷积层搜索最适合它的原创 2020-05-24 22:08:12 · 502 阅读 · 0 评论 -
Task01:赛题理解
这里写自定义目录标题赛题理解难点思路定长字符识别不定长字符识别检测再识别 赛题理解 看了官方的赛题理解,下载了SVHN公开数据集,了解了数据集的简介,并且了解了官方给的数据集:给定了相应的数字像素点的位置信息、训练集3W、验证集1W。同时此类相关检测有很多paper,所以可以找相关的算法进行了解。 难点 难点在于对不定长的字符进行识别,与传统的图像分类任务不太相同。 思路 给出了三个思路: 定长字符识别 因为所有图片中的字符总长度不大于6,所以将所有图片中的字符填充为6个,然后对每个字符分类中进行11个字符原创 2020-05-20 16:54:11 · 100 阅读 · 0 评论