计算机视觉
修行僧yicen
这个作者很懒,什么都没留下…
展开
-
CV入门赛事:街景字符编码识别-03-卷积神经网络CNN
文章目录1.CNN介绍1.1CNN模型基本概念1.1.1卷积层(Convolution)1.1.1.1 Padding操作1.1.1.2 卷积步长(stride)1.1.1.3彩色图像的卷积1.1.2池化层(Pooling)1.1.2.1 最大池化(Max pooling)1.1.2.2平均池化1.1.3激励层(activation function)1.1.4全连接层(fully connected layer,简称FC)2.主流CNN模型3.使用 Pytorch构建CNN模型3.1 CNN的一般结构3.原创 2020-05-26 20:46:13 · 491 阅读 · 0 评论 -
CV入门赛事:街景字符编码识别-02-数据读取及数据扩增
本文主要介绍如何使用python进行图片的读取和扩增图片数量1. 图像读取python中图像的读取,有以下两种常见的方式:利用Pillow库OpenCV 库方式一:利用Pillow读取from PIL import Image #导入需要的库im = Image.open('G:/python/04DataWhale/04CV基础入门/data-街景字符/mchar_train/mchar_train/000001.png')im.show()方式二:用OpenCv来读取impor原创 2020-05-23 22:10:43 · 160 阅读 · 0 评论 -
CV入门赛事:街景字符编码识别-01
写在前面该任务来源于阿里天池大赛—零基础入门CV赛事-街景字符编码识别。1.比赛任务理解本赛题来源自Google街景图像中的门牌号数据集(The Street View House Numbers Dataset, SVHN)。因此主要任务是识别数字,即从给定图片中找出数字。1.1数据理解提供的数据如下图所示为了降低比赛难度,赛事给出了字符串在图中的位置,即在mchar_train.json中给出字符串标签。如下图所示:图片中的具体含义FieldDescriptiont原创 2020-05-20 19:19:58 · 329 阅读 · 0 评论