自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 零基础入门CV赛事- 街景字符编码识别-03

字符识别模型 1.CNN模型介绍 卷积神经网络(CNN)是一种应用广泛的神经网络,在很多领域都表现优异,精度和速度比传统计算学习算法高很多。特别是在计算机视觉领域,CNN是解决图像分类、图像检索、物体检测和语义分割的主流模型。 CNN是一种层次模型,输入的是原始的像素数据。CNN通过卷积、池化、非线性激活函数和全连接层构成。 卷积层 卷积层是一组平行的特征图,它通过在输入图像上滑动不同的卷积核并运行一定的运算而组成。此外,在每一个滑动的位置上,卷积核与输入图像之间会运行一个元素对应乘积并求和的运算以将感

2020-05-26 17:51:26 344

原创 零基础入门CV赛事- 街景字符编码识别-05

数据读取与数据扩增 1.数据读取 由于赛题数据是图像数据,赛题的任务是识别图像中的字符。因此我们首先需要完成对数据的读取操作,在python中有很多库可以完成数据读取的操作,比较常见的有Pillow和OpenCV。 Pillow Pillow是python图像处理函式库(PIL)的一个分支,提供了常见的图像读取和处理操作,是应用比较广泛的库。 导入:from PIL import Image 读取:im =Image.open(‘xxx.jpg’) OpenCV OpenCV是一个跨平台的计算机视觉库,拥

2020-05-23 20:45:11 342

原创 零基础入门CV赛事- 街景字符编码识别-01

写在前面 赛题来源自Google街景图像中的门牌号数据集(The Street View House Numbers Dataset, SVHN),并根据一定方式采样得到比赛数据集。任务链接【阿里云天池大赛】零基础入门CV赛事-街景字符编码识别。 1.赛题分析 1.1数据集样本 数据集报名后可见并可下载,该数据来自真实场景的门牌号。训练集数据包括3W张照片,验证集数据包括1W张照片,每张照片包括颜色图像和对应的编码类别和具体位置;为了保证比赛的公平性,测试集A包括4W张照片,测试集B包括4W张照片。 *数

2020-05-20 21:07:30 378 1

原创 Learn_Dive-into-DL-PyTorch 第三次打卡

习题思考 1. 对抗神经网络 generator:主要是从训练数据中产生相同分布的samples,对于输入x,类别标签y,在生成模型中估计其联合概率分布。 discriminator:判断输入的是真实数据还是generator生成的数据,即估计样本属于某类的条件概率分布。它采用传统的监督学习的方法。 在实际训练中使用的损失函数为生成器使用的损失函数是 max G {−(1−y)log(1−D(...

2020-02-25 16:28:48 160

原创 Learn_Dive-into-DL-PyTorch 第二次打卡

习题思考 1. 2. 问题分析

2020-02-19 14:02:26 330

原创 Learn_Dive-into-DL-PyTorch 第一次打卡

习题思考 1. 协变量偏移、标签偏移、概念偏移等环境因素 协变量偏移 协变量变化是因为问题的根源在于特征分布的变化(即协变量的变化)。数学上,可以认为P(x)改变了,但P(y∣x)保持不变。尽管它的有用性并不局限于此,当我们认为x导致y时,协变量移位通常是正确的假设。 标签偏移 导致偏移的是标签P(y)上的边缘分布的变化,但类条件分布是不变的P(x∣y)时,就会出现相反的问题。当我们认为y导致x...

2020-02-14 18:49:51 554

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除