自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 onnx查询算子并修改内部算子与连接

onnx查询算子并修改内部算子与连接一个神奇的网站 https://fossies.org/linux/onnx/onnx/helper.py修改onnx模型中的算子连接方式import onnxruntimefrom onnxruntime.datasets import get_exampleimport onnxfrom onnx import helper, checkerfrom onnx import TensorProtoimport reimport argparse

2021-05-27 19:18:12 2121

原创 BasicVSR 视频超分

BasicVSR 视频超分

2021-04-19 12:34:20 1328

原创 warp的具体操作

warp的具体操作torch.grid_sample()可以实现warp操作,输入为一个4维input,一个光流图的channel为2,代表的是input中的坐标,具体操作就是,根据光流图中每个点的坐标,将input中对应坐标点的像素赋值到光流图的相应位置,其中光流图中每个点的坐标可能在input中无精确对应,采用的方式可以是最近邻或者双线性方式在input中获取像素,最终输出的是input经过光流图像warp后的图像,这张图像将会有对齐的特性...

2021-04-19 12:13:22 2967

原创 简单的优化方法

fixed、step、multistep、exp、polyfixed:固定学习率的优化方式step:固定步长的优化方式multistep: 不同步长的优化方式exp:指数变化的优化方式,base_lr * (gamma^iter),通过gamma控制优化速度,gamma越大,优化的步长越小poly : 指数变化的优化方式,new_lr = base_lr * (1 – iter/maxiter) ^ (power),主要有参数power影响优化变化。当power小于1时候,学习率曲线为凸优化,

2021-04-11 16:11:17 192

原创 模拟退火思路

模拟退火优化方法当求解的是有多个局部最优解的时候,为了防止优化到局部最优的位置,使用的一种优化手段。核心思路是:首先随机选择一个解作为开始,接下来通过设计的优化步长进行下一次迭代,计算迭代后的解是更接近最优解的时候,那就接受这个解为当前最优解,如果迭代后的解更远离最优解时候,按照一定概率来接受当前这个解一定概率的计算方式:通常使用函数来进行计算,dE为当前解与最优解的误差值。k为一个常数,T为一个温度,当温度0时候,结束优化。由于e的负指数值为0-1之间的值,因此P为一个0-1之间

2021-04-11 15:24:04 145

原创 efficientnetv2 (2021)轻量主干网

efficientnetv2 (2021)轻量主干网参考文章链接:https://bbs.cvmart.net/topics/4561关注点输入尺度的大小与正则复杂度对于模型性能的影响,当输入尺度小,正则要弱一些,加速收敛,之后在逐渐增加输入尺度与正则强度,有利于模型收敛。正则方式可以是,dropout、数据增强,mixup等。...

2021-04-06 20:28:00 303

原创 Calibration: 一个工业价值极大,学术界却鲜有研究的问题!

Calibration: 一个工业价值极大,学术界却鲜有研究的问题!参考论文:On Calibration of Modern Neural Networks神经网络的输出很极端,输出大多情况总是0.9,或者0.1,如果分错了,也是0.1,导致让人总是有种错觉,网络什么都会,又什么都不会,因此提出了一个决策置信度来评价模型的准确率与置信度是否匹配然而ece无法直接最小化,因此想寻找一个跟它正相关的因素来间接最小化ece,分析了模型的深度与宽度,bn等的影响,最后发现模型的拟合成程度与与ece直接

2021-04-06 12:35:41 308

原创 Mask guide matting via progressive refienment network(2020,trimap)

Mask guide matting via progressive refienment network(2020,trimap)网络结构:Unet结构,resnet34 添加ASPP,主要思想是协调高低层特征的学习,主要提出了PRM方式去学习,对于每一层的alpha matte输出,都有一个监督信号,按照alpha的值在0-1的时候,将其位置设为1,用于表示仍然需要学习的区域,当alpha的值为0或者1时,将其位置设为0,表示已经学好的位置,实际使用的是步长为8,4,1的特征图进行alph

2021-04-06 12:30:58 440

原创 end to end animal matting(2020,trimap-free)

end to end animal matting(2020,trimap-free)网络分析:encoder网:resnet43或者densenet121,预训练模型ImageNet,添加一个卷积层将输出特征通道改为512.decoder网络:主要由3x3的卷积与上采样组成,PPM:金字塔池化模,获取更多的全局语义信息,BB:包括三个卷积层,使用的是3x3的膨胀卷积,dilation为2,主要为了获取更多的细节,同时将低层的特征也融合。GD:输出的是粗分割结果,这里有三种输出方式,TT为三

2021-04-06 12:28:07 279

原创 BackgroundV2(2020,background)

BackgroundV2(2020,background)网络结构:网络是两部分组成,一个粗分割base网络,一个精细分割refiner网络,其中预测的时alpha与一个前景残差,Fr = F-I组成,研究人员说这对于网络有好处base网络:全卷积的encoder-decoder网络,类似于deeplabv3与deeplabv3+结构,主干网是resnet50,或者其他mobilenetv2,最后添加ASPP模块,其中有多种尺度的膨胀卷积核,解码encoder网络使用双线性差值,与主干网的跳层进行

2021-04-06 12:23:25 133

原创 GCA matting(2020, trimap)

GCA matting(2020, trimap)网络结构:网络主要是一个Unet结构,一目了然。其中主要有两个特殊结构,一个image feature block,一个GCA blockimage feature block,主要是提取图像的低层特征,是3x3,stride为2的卷积GCA block: 有两个特征流,一个alpha预测特征流,一个图像特征流,思想来源于图像修复,经输入额图像特征流分为已知区域于未知区域,通过3x3的patch进行划分,之后reshape为卷积核与未知区域进行

2021-04-06 12:19:36 1009

原创 MOD matting(2020 trimap-free)

MOD matting(2020 trimap-free)网络结构:一个低分辨率分支估计人类语义一个高分辨率分支估计边缘细节一个融合分支预测最终alpha模版损失函数:S模块使用的是alpha L2的损失,D模块使用的是alpha L1的损失,,其中计算的是边缘未知区域的,F模块使用的是alpha的L1损失与一个compositional 损失。训练方法:突出了一个新人像抠图数据库PPM-100,为了适应于真实世界的数据,提出了一个无监督训练方法,单独调整的loss为因为

2021-04-06 12:15:00 404

原创 High-Resolution Deep Image Matting(2020)

High-Resolution Deep Image Matting网络结构Encoder E编码起为resnet34与ASPP,解码器主要用unpool操作作为上采样来进行解码操作主要将高分辨率图像进行裁剪成不同的patch小块进行预测,为了解决bu同的patch直接产生的信息不联系与单独patch中的信息缺失问题,提出cpc网络来解决。对输入图像与trimap在不同位置进行随机抠图,之后resize到同一大小。对于边界超出部分使用反射法进行填充,对于每一个patch 都会与其他patch

2021-04-06 12:14:39 338

原创 FBA_Matting(2020)

FBA_Matting(2020)网络结构:主要是一个Unet网络结构,编码encoder网络使用的是resnet-50,权重用imagenet训练的模型。相比于原始resnet-50有两处修改,a、输入从3通道改为9通道,其中包括rgb与3组trimpa图像,使用三个不同个尺度的高斯模糊生成。b、移除layer3与layer4的stride,增加孔洞卷积,孔洞为2与4(类似alphagan)。解码decoder网络是一个金字塔pooling层,主要包括7个卷积层与三线性插值与跳层链接。输出层:包

2021-04-06 12:14:20 937

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除