计算机视觉
goddesshs
这个作者很懒,什么都没留下…
展开
-
天池&Datawhale- 街景字符编码识别
天池&Datawhale- 街景字符编码识别 Task 3构建字符识别模型 CNN发展 LeNet-5 AlexNet VGG-16 Inception-v1 ResNet-50 用pytorch构建CNN模型 pytorch中只需要定义好模型的参数和正向传播 可改进方向: 1.baseline中对每个字符是同等对待的,简单将每个字符分类的错误率相加,可考虑为不同位置字符分配不同的权重 ...原创 2020-05-26 23:06:40 · 179 阅读 · 0 评论 -
天池&Datawhale- 街景字符编码识别
天池&Datawhale- 街景字符编码识别 Task2 有关数据 数据读取 Python常用的图像读取与处理的库有两个:PIL和openCV 导入PIL库中Image模块:from PIL import Image 读取图像 Image.open(‘cat.jpg’) 导入Opencv库:import cv2 读取图像 cv2.imread(‘cat.jpg’) 注意:PIL读取图像是根据RGB通道读取,openCV读取图像是根据BGR通道读取 数据扩增 原因:由于本任务使用深度神经网络,参数规模原创 2020-05-23 23:27:24 · 316 阅读 · 0 评论 -
天池&Datawhale- 街景字符编码识别
天池&Datawhale- 街景字符编码识别 Task1 赛题理解 赛题背景 需要选手预测真实场景下的字符识别,这是一个典型的字符识别问题**(分类问题)** 数据集说明 数据集来源自Google街景图像中的门牌号数据集(The Street View House Numbers Dataset, SVHN),并根据一定方式采样得到比赛数据集。 训练集数据包括3W张照片,验证集数据包括1W张照片,每张照片包括彩色图像、对应的编码类别和具体位置。 数据包组成 训练集图片文件夹(3W张,png格式),验原创 2020-05-19 22:28:54 · 306 阅读 · 0 评论