![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
深度学习
文章平均质量分 79
是暮涯啊
很多人,很多事,过去了就再也回不来了,珍惜当下,把握现在!
展开
-
CVPR2023 Deblur论文整理
Paper list 来自 https://github.com/DarrenPan/Awesome-CVPR2023-Low-Level-Vision#image-deblurring简单用GPT翻译一下摘要。原创 2023-08-31 22:25:31 · 1325 阅读 · 0 评论 -
深度学习MEMC插帧论文列表paper list
整理一下深度学习用于运动估计和运动补偿的论文列表。大致按照内容与时间区分。鉴于工作量太大,而且MEMC这块点击量很少,就不介绍文章内容了。原创 2022-07-24 15:55:28 · 2143 阅读 · 0 评论 -
深度学习图像数据增强
作为cv的基础,数据增扩是很重要的一环。一般来说主要有以下几种:1、通过openCV操作 2、使用torchvision.transform 3、使用torchvision.transform.function 4、使用nvidia.dali 5、albumentations库。对应的数据也一般可以分为1、单图处理,如分类。2、同尺寸多个数据处理,如分割,去噪。3、不同尺寸多个数据处理,如超分。下面将按照方法简单总结一下。几何变换旋转,缩放,翻转,裁剪,平移,仿射变换色彩空间亮度,对比度,饱和度,原创 2022-06-07 10:32:09 · 899 阅读 · 1 评论 -
光流估计中cost volume详解
原创声明:是暮涯啊我认为之所以光流估计中会使用独有的cost volume,其初始形态是传统基于块的光流估计方法中,对每个前一帧图像F1中的某个块B1,计算其在一定范围内对应于后一帧图像2中哪个块B2最接近。假如B1的坐标为(x1,y1)B2的坐标为(x2,y2),对应这个块的光流矢量就是(x2-x1,y2-y1)。1、FlowNet中的correlation1.1 介绍FlowNet作为光流估计的开山鼻祖,对correlation的计算花了大量篇幅。作者说这些分割啊,深度估计啊这些网络可以产生像素原创 2022-05-12 18:02:31 · 4145 阅读 · 2 评论 -
运动估计运动补偿(Motion estimation and motion compensation,MEMC)入门总结
本文不生产内容, 本文制作内容的搬运工,希望通过本文系统性的整理,能够让您对该领域具有整体的认识。认准原创文章将按照以下目录展开:原创 2022-04-28 15:31:12 · 6442 阅读 · 0 评论 -
ISP论文整理2
上一篇是整理了一些顶会顶刊的AI ISP论文,这里整理一些workshop或者arxiv之类的论文。7、Deep Camera: A Fully Convolutional Neural Network for Image Signal Processin(ICCVW19)论文 被引20说这个传统分阶段ISP会把每个步骤的loss累加并降低最终图像质量。因此用全卷积网络替代缺陷像素校正、去噪、白平衡、曝光校正、去马赛克、颜色变换和伽马编码(defect pixel correction, denois原创 2022-04-13 11:47:01 · 4892 阅读 · 1 评论 -
ISP论文整理1
我又转到ISP来看论文啦,鉴于之前博客经常被抄,我要先写个原创声明。本文为是暮涯啊在CSDN创作,认准原创地址 未经允许,请勿转载。原创 2022-04-11 16:20:06 · 5281 阅读 · 1 评论 -
去噪论文整理总结
记录一些去噪领域的顶会论文1、Image denoising by sparse 3-d transform-domain collaborative filtering(BM3D,TIP2007)论文 引用7000+翻译代码讲解2、Weighted nuclear norm minimization with application to image(WNNM,CVPR2014)论文 被引1400+3、From Learning Models of Natural Image Patch原创 2022-04-05 18:01:40 · 7057 阅读 · 1 评论 -
经典超分论文总结5
继续膜拜xintao wang大佬,大佬到了腾讯后更是杀疯了,之前在港中文中的两篇worshop被引爆炸,现在要中就中正刊。本文介绍最新的GFPGAN和Real-ESRGAN,都是SISR和盲超分。4、GFPGAN:Towards Real-World Blind Face Restoration with Generative Facial Prior (CVPR 2021)本篇论文专著于人脸的超分,效果我愿称之为最强。话不多说,先上张对比看看4.1 摘要盲超分通常需要脸部先验(脸部几何先验或参原创 2021-12-21 15:57:55 · 2549 阅读 · 0 评论 -
经典视频超分论文总结4
继续看论文,感觉头发都要掉完了,哭==这次写paperWithCode上vid4榜首的两篇论文10 Deep Video Super-Resolution Network Using Dynamic Upsampling Filters Without Explicit Motion Compensation(VSR-DUF, CVPR18)震惊,18的论文能效果拍这么靠前。从题目就知道这篇文章的贡献是提出了一个动态上采filter,替代了其他论文中的MC。10.1 网络结构这部分不是重点,大概看原创 2021-12-15 19:30:30 · 3697 阅读 · 0 评论 -
经典视频超分论文总结3
本次写一写清华大佬Takashi Isobe的三个超分作品,大佬一年内,而且好像还是在华为实习期间连续中了三篇顶会,代码都开源在他自己的github中。1、REVISITING TEMPORAL MODELING FOR VIDEO SUPER-RESOLUTION(RRN,BMCV2020)本文其实很像上篇提到的FRVSR,也是采用RNN做超分,不同之处在于引入了残差结构1.1 摘要1)作者认为做超分因为loss不同,所以直接比结果是无效的。(这点确实,l2 loss会明显提高psnr计算结果,但原创 2021-12-15 15:11:15 · 2925 阅读 · 0 评论 -
经典视频超分论文总结2
书接上回,咱继续写paperwithcode中VID4排行榜上的论文前面的论文可以查看地址经典视频超分论文总结1经典视频超分论文总结27、Detail-revealing Deep Video Super-resolution(DRDVSR, ICCV2017)港中文的工作,贾佳亚大佬背书,虽然有公开代码,但是直接使用pb文件,所以无法查看具体模型。即使把pb用tensorboard可视化出来也超级乱。推荐另一个torch复现的代码。7.1 先说一下动量估计(Motion Estimation原创 2021-12-14 10:16:49 · 3191 阅读 · 0 评论 -
经典视频超分论文总结1
本文总结一下PaperWithCode中VID4榜上的几篇超分论文。1、Bidirectional Recurrent Convolutional Networks for Multi-Frame Super-Resolution(BRCN, NeurIPS 2015)https://proceedings.neurips.cc/paper/2015/file/c45147dee729311ef5b5c3003946c48f-Paper.pdfhttps://proceedings.neurips.cc原创 2021-10-22 18:47:11 · 1623 阅读 · 0 评论 -
pytorch加载模型错误 RuntimeError: Error(s) in loading state_dict for Model: Missing key(s) in state_dict
闲的没事,写写模型加载。模型在保存时侯以键对值保存,同时在加载时根据现在网络的键值查找模型对应的键值,然后加载。一般报错是因为模型和网络的键值不匹配。1、最常见的问题是键值多了或者少了 module.此种情况是模型在DataParallel或者DDP训练后保存的键值有module.,对应的网络的键值则没有module.1)可以通过:model = nn.DataParallel(model)将模型的键值加上module.2) 也可以通过遍历模型的键对值修改键值。 如:...原创 2021-10-14 20:03:55 · 6343 阅读 · 0 评论 -
zero-shot基础入门
好早前看了一下zero-shot的文章,并进行整理做成了PPT,今天上班有空分享一下。每张PPT下都有链接,更详细的介绍可以查看链接。1、定义这是zero-shot介绍时常用的一张图,从见过的类别(第一列)中提取特征(如:外形像马、条纹、黑白),然后根据对未知类别特征的描述,测试未见过的类别。...原创 2021-10-09 17:06:11 · 16288 阅读 · 0 评论 -
numpy array转tensor
1、torch.tensor(data,*,dtype=None,device=None,requires_grad=False,pin_memory=False) 最推荐数据类型:和输入相同,可以使用dtype改变数据类型拷贝类型:总是深拷贝; 如果数据为tensor,不想拷贝,使用torch.Tensor.requires_grad_()ortorch.Tensor.detach()具体参考:https://pytorch.org/docs/stable/gener...原创 2021-08-27 11:26:07 · 7947 阅读 · 0 评论 -
Linux使用VMAF
作为一个初入超分的新手,被安排测试一下怎么使用VMAF。哎,主人的任务罢了当我搜索“怎么使用VMAF”时,各个奇奇怪怪的教程没有一个统一的,使用环境也不说,各种采坑。所以本篇使用方法基本是对VMAF github仓库的ReadMe翻译而来,过程自己跑过没问题。0、环境ubantu18、Python3.61、新建虚拟环境本步骤我没有走,使用自己原先的环境也可以的。如果走可以按照以下代码创建:python3 -m pip install virtualenvpyth.原创 2021-07-23 11:10:41 · 1245 阅读 · 2 评论 -
nnunet代码使用
nnunet作为一个医学分割中神一样的代码。有很多地方可能在运行时需要改进。这就要求我们不能仅满足于安装nnunet包,并通过官方命令运行。而应对代码进行修改。本文主要讲解在下载nnunet后如何通过修改代码运行。关于nnunet的讲解,和安装nnunet包,使用命令运行的方法推荐这个博主的四篇文章。阅读本文是可以同时参考官方使用教程1、设置conda环境为了避免环境适配的问题,最好安装一个新的conda环境。python3, torch1.6以上。温馨提供:安装conda环境.原创 2021-06-21 18:18:09 · 5263 阅读 · 2 评论 -
os.environ[‘CUDA_VISIBLE_DEVICES‘] 无效
eaaaaa 我又要被自己蠢哭了我搜了好多原因,比如把位置放在torch使用之前,其他文件中重复定义等等原因都没有解决。后来发现是我敲代码时候用了小写我写的是:os.environ['cuda_visible_devices'] = "1,2,3"应该是: os.environ['CUDA_VISIBLE_DEVICES'] = “1,2,3”最后注释: 该命令作用是定义网络可以看到的物理显卡编号。和 nn.DataParallel(model, device_ids...原创 2021-05-06 21:37:02 · 4037 阅读 · 2 评论 -
ImportError: cannot import name ‘constraints‘ from ‘keras.layers‘
keras早期版本中,导入initializers,regularizers,constraints等模块为:from keras.layers import initializers,regularizers,constraints现应为:from keras import initializers,regularizers,constraints具体见keras中文文档原创 2021-04-18 13:14:48 · 1909 阅读 · 0 评论 -
Word2Vec TypeError: __init__() got an unexpected keyword argument ‘size‘
在代码model = word2vec.Word2Vec(sentences=texts, size=300, window=3, workers=2)中使用Word2Vec时报错TypeError: __init__() got an unexpected keyword argument 'size' 解决方法根据官方手册,将size改为vector_size即:model = word2vec.Word2Vec(sentences=texts, vecto.原创 2021-04-16 20:47:54 · 21679 阅读 · 0 评论 -
ModuleNotFoundError: No module named ‘fastText‘
1、确保安装过此包安装命令为:pip install fastText2、我遇到的问题是安装成功,但是import仍然找不到具体问题如下:(nlp) ***@*****:/home2/**/NLPLearn/codes/chatservice$ pip install fastTextRequirement already satisfied: fastText in /home/***/anaconda3/envs/nlp/lib/python3.7/site-packages原创 2021-04-11 19:59:44 · 2288 阅读 · 1 评论 -
图像分割中的Dice Loss
本文只总结我对Dice Loss的一些理解1、首先简单介绍一下,这个不多说,详细如知乎所讲。Dice 定义为2倍交集/和, 范围在[0,1]:Dice Loss 取反或者用1-,定义为:2、Dice Loss 与 BCE 的结合各自的作用。Dice Loss与交叉熵经常搭配使用,具有以下优点:1)Dice Loss相当于从全局上进行考察,BCE是从微观上逐像素进行拉近,角度互补。2)当出现前后景极不均衡情况时。如一个512*512的图片只有一个10*10的分割样例。BCE原创 2020-12-27 20:17:21 · 15762 阅读 · 12 评论 -
深度学习算法面试问题整理
1、首先来一个手推BP反向传播 推荐《NeuralNetworkandDeepLearning》中的四个公式。 详细可以看这篇博文, 再详细点可以看????的书。2、One-hot的作用是什么?为什么不直接使用数字作为表示 作用:1)将类别变量转换为机器学习算法易于利用的一种形式的过程。如:网络一般通过softmax层输出,它的输出是一个 概率分布,从而要求输入的标签也以概率分布的形式出现,进而......原创 2020-07-17 15:44:48 · 3031 阅读 · 0 评论 -
python计算连通域
使用skimage的measure.label。可获得不同连通域from skimage import measurelabel, num = measure.label(les_array, connectivity=2, background=0, return_num=True)# 返回的label是将连通域标注为1,2,3。。。的标签# num 连通域个数参数介绍:详见:https://scikit-image.org/docs/dev/api/skimage.mea..原创 2020-05-23 20:48:02 · 5942 阅读 · 0 评论 -
cv2.error:opencv(3.4.2) /tmp/build/ error (-251:Assertion failed) VScn::contains(scn)
使用cv2将rgb转hcv遇到该问题原始错误代码:img = np.zeros([ct_array_crop.shape[1], ct_array_crop.shape[2], 3])img_slice = ct_array_crop[0]img[:,:,0], img[:,:,1], img[:,:,2] = img_slice, img_slice, img_sliceimg...原创 2020-05-03 16:34:30 · 887 阅读 · 0 评论 -
pytorch将标签转为onehot
由于想多分类中使用Diceloss,所以需要将[0,1,2,..N]类型的标签转化为onehot类型。input数据类型: torch.LongTensor() 数据形状:[bs, 1, *] 可为2D或3D数据 def make_one_hot(input, num_classes): """Convert class index t...原创 2020-04-20 17:47:42 · 8091 阅读 · 1 评论 -
医学图像的各向同性与各向异性
根据我对大佬文章http://www.360doc.com/content/19/0625/22/43825132_844846900.shtml 的理解。好像是:各向同性就是各个方向体素相同,如文件的体素空间(spacing)为 1mm*1mm*1mm各向异性就是不同, 如文件的体素空间(spacing)为 1mm*1mm*5mm具体各位可继续慢慢细读上文链接。...原创 2020-04-08 19:32:34 · 3247 阅读 · 4 评论 -
pytorch交叉熵使用方法
交叉熵相关理论网上好多,这篇只记录一下在分割中怎么用torch.nn.BCELoss 和torch.nn.CrossEntropyLoss,也方便自己以后使用。1、二分类用nn.BCELossoutput: 定义: 网络的输出 数值: 需要经过sigmoid()函数归一化到[0,1], shape: [bs,*] # *表示长宽高等任意...原创 2020-04-01 20:09:18 · 6030 阅读 · 4 评论 -
nn.Upsample对不同维度tensor上采样
torch中,我现在想把一个纬度为[bs, channel, depth, height, width]的3D tensor通过nn.Upsample转换为 [bs, channel, depth, height*2, width*2]的tensor则,init定义上采样是应为:self.upsacle = nn.Upsample(scale_f...原创 2020-03-16 20:32:03 · 3487 阅读 · 0 评论 -
anaconda使用清华镜像下载SimpleITK
所有博客都告诉我说,官网让用命令conda install -c simpleitk simpleitk下载SimpleITK包,但问题是这个太慢了吧!!我也按照教程:https://blog.csdn.net/SpadgerZ/article/details/103185777利用conda config --add channels https://mirrors.tu...原创 2020-03-04 16:48:15 · 5634 阅读 · 8 评论 -
Python2.7与Python3.0在学习中的差异点
1、pickle的改变这里需要把MNIST里的src文件夹下的mnist_loader.py里的相关代码改一下。首先由于python3里不再有cPickle模块,所以只能用pickle,所以将import cPickle改为import pickle但由于python3里pickle的load函数也有改变,即使前面已经是以二进制形式打开文件,也会出错原创 2018-01-06 15:56:35 · 946 阅读 · 0 评论 -
Python2.7与Python3.0在学习中的差异点 (二)
学习深度学习基础讲解教程《零基础入门深度学习》https://www.zybuluo.com/hanbingtao/note/433855时遇见问题1、匿名函数lambda()问题运行代码 return self.activator( reduce(lambda a, b: a + b, map(lam原创 2018-01-06 21:56:08 · 2218 阅读 · 0 评论 -
GitHub学习中的一些错误及解决方法
今天根据廖雪峰老师的教程https://www.liaoxuefeng.com/wiki/0013739516305929606dd18361248578c67b8067c8c017b000学习了一些GitHub的知识,先将学习过程中的一些问题及解决进行分享1、fatal: Not a git repository (or any of the parent directories): .git ...原创 2018-02-25 16:45:47 · 1445 阅读 · 0 评论 -
window环境下 caffe训练cifar10
今天利用caffe训练cifar10,为以后用ResNET训练做准备,主要是遇到的小问题,总结如下:1、训练过程:我本人直接参考:https://www.cnblogs.com/zl20pn/p/6218958.html点击打开链接教程非常详细,不再多说。2、遇到的问题(1)训练cifar10 check failed:data_file unable to open train file ...原创 2018-03-21 18:39:52 · 162 阅读 · 0 评论 -
Linux安装tensorlayer
这个tensorlayer安装真是一个血泪史,特此记录一下先说结果,再说过程结果我最终实在Ubantu14,tensorflow1.2.1, cuda8.0上安装的tensorlayer1.5版本安装只需要一行命令:sudo pip install tensorlayer==x.xx.x为版本号,最多你想安装好了之后在修改版本,就用sudo pip insta...原创 2018-07-24 15:21:39 · 1930 阅读 · 1 评论 -
风格迁移 RuntimeError: storage has wrong size: expected 16825408 got 256
闲着试一下风格迁移,pytorch0.4,python3,windows系统尝试使用了:http://www.pytorchtutorial.com/pytorch-style-transfer/https://blog.csdn.net/zzlyw/article/details/78849250提供的代码,在此先感谢两篇文章的作者但是都遇到了...(之前省略)...原创 2018-08-15 20:44:19 · 10115 阅读 · 0 评论 -
torch将label转为OneHot遇到的问题
方法同: https://www.jianshu.com/p/15b1b809074c遇到问题报错:Traceback (most recent call last): File "<stdin>", line 1, in <module> File "/usr/lib/python3/dist-packages/spyderlib/widgets/exte...原创 2019-07-17 18:10:55 · 2025 阅读 · 3 评论 -
torch将tensor类型的数据进行可视化
1、将tensor转为array类型。假设此时image是tensor类型,利用下面语句转为array。img_np = image.numpy()2、利用cv2将array转为图片并保存img_np = img_np[0].transpose([1,2,0]) #取出其中一张并转换维度img_np = (img_np - np.min(img_np))/(np.m...原创 2019-09-24 10:40:24 · 3306 阅读 · 1 评论 -
Alexnet,Vgg, GoogleNet,resnet等常见模型torch版本代码github地址
https://github.com/pytorch/vision/blob/master/torchvision/models原创 2019-09-28 12:32:07 · 627 阅读 · 0 评论