CV入门学习记录
jxwnj_1210
这个作者很懒,什么都没留下…
展开
-
Datawhale 零基础入门CV赛事-Task5 模型集成
Task5 模型集成提高深度学习模型精度的方法1.DropoutDropout可以作为训练深度神经网络的一种技巧。在每个训练批次中,通过随机让一部分的节点停止工作。同时在预测的过程中让所有的节点都其作用。Dropout经常出现在在先有的CNN网络中,可以有效的缓解模型过拟合的情况,也可以在预测时增加模型的精度。在全连接神经网络中使用方法:class Classifier(nn.Module): def __init__(self): super().__init__()原创 2020-06-02 22:48:54 · 85 阅读 · 0 评论 -
Datawhale 零基础入门CV赛事-Task4 模型训练与验证
零基础入门CV赛事-Task4 模型训练与验证1 构建验证集训练集和验证集是分开的,所以模型在验证集上面的精度在一定程度上可以反映模型的泛化能力。在划分验证集的时候,需要注意验证集的分布应该与测试集尽量保持一致,不然模型在验证集上的精度就失去了指导意义。这里的分布一般指的是与标签相关的统计分布,比如在分类任务中“分布”指的是标签的类别分布,训练集-验证集-测试集的类别分布情况应该大体一致;如果标签是带有时序信息,则验证集和测试集的时间间隔应该保持一致。本题是直接给出了测试集和训练集。train_原创 2020-05-30 19:24:44 · 103 阅读 · 0 评论 -
Datawhale 零基础入门CV赛事-Task3 字符识别模型
1、构建MNIST数据的CNN模型为更好的完成这道题,作者先去学习了一下经典字符识别MNIST的CNN模型:class Net(nn.Module): def __init__(self): super(Net,self).__init__() self.conv1=torch.nn.Conv2d(1,10,kernel_size=5) self.conv2=torch.nn.Conv2d(10,20,kernel_size=5)#卷积原创 2020-05-26 19:16:39 · 86 阅读 · 0 评论 -
Datawhale 零基础入门CV赛事-Task2 数据读取与数据扩增
数据读取与数据扩增1、图像读取在本赛题中,我们主要使用openCV,OpenCV是一个跨平台的计算机视觉库,最早由Intel开源得来。OpenCV发展的非常早,拥有众多的计算机视觉、数字图像处理和机器视觉等功能。```pythonimg=cv2.imread('mchar_train/000003.png')img=cv2.cvtColor(img, cv2.COLOR_BGR2RGB)img=cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)``2、Pytorc原创 2020-05-23 18:20:59 · 96 阅读 · 0 评论 -
计算机视觉CV入门-街景字符识别-Task1.赛题理解
街景字符识别-Task1.赛题理解文字识别是计算机视觉研究领域的分支之一,归属于模式识别和人工智能,是计算机科学的重要组成部分。赛题背景计算机文字识别,俗称光学字符识别,英文全称是Optical Character Recognition(简称OCR),它是利用光学技术和计算机技术将图片上的文字读取出来,并转换成一种计算机能够接受、人又可以理解的格式。OCR技术是实现文字高速录入的一项关键技术。但现在更流行使用基于深度学习下的CNN字符识别。图像预处理相关理论1、图像预处理输入文本经过扫描仪进入原创 2020-05-20 19:30:18 · 299 阅读 · 0 评论