自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(113)
  • 收藏
  • 关注

原创 谈谈哲学~

晚上日常听王德峰讲哲学,闲着没事做点摘要总结。1、儒道互补儒家讲求入世,道家讲求出世。因此庄子说:相濡以沫,不如相忘于江湖。中国知识分子讲求经世致用,但当世道不允许时候,他们不至于走极端,而追求道家提倡的出世。如陶渊明、魏晋时期的竹林七贤2、中西追求中国传统追求安心立命。中国人认为人是在君臣、父子、兄弟、夫妇、朋友五种人伦关系之中,西方讲究追求个人的自我价值实现。我认为,虽然表面上来看中国人活得更累,因为要为周围人活着,西方却可以活的自我,这确实也是现在很多年轻人的想法。但在我国向西方学习的

2021-10-14 15:57:03 170

原创 部署个人静态网站到阿里云服务器(含域名解析)

总结部署个人网站到服务器的教程

2023-10-15 17:50:47 343

原创 ERROR: Could not build wheels for opencv-python which use PEP 517 and cannot be installed d

Python3.6适配的opencv版本是opencv-python 4.5.4.60。第一种可能性当然是 更新setuptools。就是python和opencv版本不匹配。

2023-09-26 11:16:28 1850 1

原创 A Simple Baseline for Video Restoration with Grouped Spatial-temporal Shift(ShiftNet)

视频修复旨在从降质的视频中恢复清晰的帧,具有许多重要的应用。。然而,现有的深度学习方法往往依赖于复杂的网络架构,如光流估计、可变形卷积和跨帧自注意层,导致计算成本高。在这项研究中,我们提出了一个简单而有效的视频修复框架。我们的方法基于分组空间时间位移(grouped spatial-temporal shift),这是一种轻量级和直观的技术,可以。通过引入分组空间位移,我们获。结合基本的2D卷积,这个简单的框架可以有效地聚合帧间信息。

2023-09-13 23:08:54 355

原创 Activating More Pixels in Image Super-Resolution Transformer(HAT)超分

基于Transformer的方法在低级视觉任务(如图像超分辨率)上表现出令人印象深刻的性能。然而,我们发现这些网络只能通过归因分析利用有限的输入信息空间范围。这意味着Transformer的潜力在现有网络中仍未得到充分利用。为了激活更多输入像素以获得更好的重构效果,我们提出了一种新颖的混合注意力Transformer(Hybrid Attention Transformer,HAT)。它结合了通道注意力和基于窗口的自注意力方案,从而利用全局统计和强大的局部拟合能力。

2023-09-13 22:43:04 478

原创 CVPR2023 Deblur论文整理

Paper list 来自 https://github.com/DarrenPan/Awesome-CVPR2023-Low-Level-Vision#image-deblurring简单用GPT翻译一下摘要。

2023-08-31 22:25:31 1119

原创 undefined symbol: _ZN2at5sliceERKNS_6TensorElN3c108optionalIlEES5_l

安装mmcv报错

2023-08-09 16:09:16 388

原创 ImportError: /lib/x86_64-linux-gnu/libstdc++.so.6: version `GLIBCXX_3.4.29‘ not found

如果是import matplotlib 遇到该问题,就采用如下代码重装matplotlib。如果是import skimage 遇到该问题,就采用。

2023-07-31 19:56:19 132

原创 统计神经网络参数量、MAC、FLOPs等信息

通过stat、thop、fvcore等工具统计常见CNN,Transformer的参数量,Mac,flops等信息

2023-07-27 23:27:14 1191

原创 ImportError: libgthread-2.0.so.0: cannot open shared object file: No such file or directory

安装cv2遇到库缺失问题

2023-06-29 10:58:46 208

原创 图像评价指标IE, NIE

单独介绍一下图像评价指标 IE和NIE。

2023-06-01 22:33:04 346

原创 C++调用libtorch1.12遇到的几个问题

c++调用libtorch遇到的常见问题

2022-10-19 16:28:14 1586 4

原创 中值滤波,均值滤波,高斯滤波,双边滤波,联合双边滤波介绍

看GAMES202相关课程发现闫老师讲的太好了,所以记录一下。当然文中涉及的PPT也来自闫老师的课程PPT,欢迎交流。首先这几种都是空域的滤波方式,用于抑制图像中的噪声。它们采用的原理基本都是通过滤波核K处理含噪图像C,得到干净的输出图C。滤波核:在处理图像位于坐标 i 处的值时,需要考虑其周围j个位置的坐标(包含i本身)。这j个相邻位置即为滤波核。图像的边缘一般像素变化大,包含高频信号;图像中连续部分像素间差距小,一般是低频信号。...

2022-08-28 14:42:33 4975 1

原创 插帧中grid_sample函数详解

MEMC,VSR 常用的warp操作中grid_sample函数

2022-07-31 15:03:04 2623 1

原创 深度学习MEMC插帧论文列表paper list

整理一下深度学习用于运动估计和运动补偿的论文列表。大致按照内容与时间区分。鉴于工作量太大,而且MEMC这块点击量很少,就不介绍文章内容了。

2022-07-24 15:55:28 2052

原创 深度学习图像数据增强

作为cv的基础,数据增扩是很重要的一环。一般来说主要有以下几种:1、通过openCV操作 2、使用torchvision.transform 3、使用torchvision.transform.function 4、使用nvidia.dali 5、albumentations库。对应的数据也一般可以分为1、单图处理,如分类。2、同尺寸多个数据处理,如分割,去噪。3、不同尺寸多个数据处理,如超分。下面将按照方法简单总结一下。几何变换旋转,缩放,翻转,裁剪,平移,仿射变换色彩空间亮度,对比度,饱和度,

2022-06-07 10:32:09 873 1

原创 光流估计中cost volume详解

原创声明:是暮涯啊我认为之所以光流估计中会使用独有的cost volume,其初始形态是传统基于块的光流估计方法中,对每个前一帧图像F1中的某个块B1,计算其在一定范围内对应于后一帧图像2中哪个块B2最接近。假如B1的坐标为(x1,y1)B2的坐标为(x2,y2),对应这个块的光流矢量就是(x2-x1,y2-y1)。1、FlowNet中的correlation1.1 介绍FlowNet作为光流估计的开山鼻祖,对correlation的计算花了大量篇幅。作者说这些分割啊,深度估计啊这些网络可以产生像素

2022-05-12 18:02:31 3819 2

原创 运动估计运动补偿(Motion estimation and motion compensation,MEMC)入门总结

本文不生产内容, 本文制作内容的搬运工,希望通过本文系统性的整理,能够让您对该领域具有整体的认识。认准原创文章将按照以下目录展开:

2022-04-28 15:31:12 6136

原创 ISP论文整理2

上一篇是整理了一些顶会顶刊的AI ISP论文,这里整理一些workshop或者arxiv之类的论文。7、Deep Camera: A Fully Convolutional Neural Network for Image Signal Processin(ICCVW19)论文 被引20说这个传统分阶段ISP会把每个步骤的loss累加并降低最终图像质量。因此用全卷积网络替代缺陷像素校正、去噪、白平衡、曝光校正、去马赛克、颜色变换和伽马编码(defect pixel correction, denois

2022-04-13 11:47:01 4818 1

原创 ISP论文整理1

我又转到ISP来看论文啦,鉴于之前博客经常被抄,我要先写个原创声明。本文为是暮涯啊在CSDN创作,认准原创地址 未经允许,请勿转载。

2022-04-11 16:20:06 5172 1

原创 去噪论文整理总结

记录一些去噪领域的顶会论文1、Image denoising by sparse 3-d transform-domain collaborative filtering(BM3D,TIP2007)论文 引用7000+翻译代码讲解2、Weighted nuclear norm minimization with application to image(WNNM,CVPR2014)论文 被引1400+3、From Learning Models of Natural Image Patch

2022-04-05 18:01:40 6841 1

原创 Transformer用于超分辨率重建

记录几篇Transformer的超分辨率重建论文。1 Learning Texture Transformer Network for Image Super-Resolution(TTSR, CVPR2020)本文引用已经有200多了。 原文链接1.1 摘要文章做的是RefSR工作,主要观点是将Transformer作为一个attention,这样可以更好地将参考图像(Ref)的纹理信息转移到高质图像(HR)中。做法还是比较有意思的,如下图所示,将上采样的LR图像、依次向下/上采样的Ref图像、原

2022-04-01 09:41:58 12012

原创 linux xorg占用显存过大

问题要治标更要治本好吧这个问题的根本原因是电脑使用独显作为显示输出,解决方法当然是使用集显作为显示输出,独显单独用来cuda运算。所以很多教程Ctrl+Alt+F1进入文本模式,再用Ctrl+Alt+F7回来看,xorg占用的显存变小了。这只是治标,因为进入文本模式回来很多图形化界面都关了呀,所以暂时变小了。后面使用如果打开还是会继续占用的。解决方案是啥,重装显卡驱动,把图形化界面放到集显去。集体教程看台式机ubuntu,使用intel核显作显示输出,nvidia独显做cuda运算_feyn

2022-03-03 20:31:01 3233

原创 ffmpeg生成的视频与QuickTime不兼容

问题描述在使用图片生成视频命令ffmpeg -r 25 -f image2 -s 3840x2160 -i pic/%05d.png -vcodec libx265 -crf 25 -pix_fmt yuv420p out.mp4 -y生成h265编码的视频,但是无法在QuickTIme直接播放,显示不兼容。解决方法:1、使用命令将该视频进行转换ffmpeg -i out.mp4 -c:v libx265 -vtag hvc1 output.mp4重点在于 -vtag hvc1 这个命令

2022-02-09 09:53:59 3205

原创 经典超分论文总结5

继续膜拜xintao wang大佬,大佬到了腾讯后更是杀疯了,之前在港中文中的两篇worshop被引爆炸,现在要中就中正刊。本文介绍最新的GFPGAN和Real-ESRGAN,都是SISR和盲超分。4、GFPGAN:Towards Real-World Blind Face Restoration with Generative Facial Prior (CVPR 2021)本篇论文专著于人脸的超分,效果我愿称之为最强。话不多说,先上张对比看看4.1 摘要盲超分通常需要脸部先验(脸部几何先验或参

2021-12-21 15:57:55 2477

原创 经典视频超分论文总结4

继续看论文,感觉头发都要掉完了,哭==这次写paperWithCode上vid4榜首的两篇论文10 Deep Video Super-Resolution Network Using Dynamic Upsampling Filters Without Explicit Motion Compensation(VSR-DUF, CVPR18)震惊,18的论文能效果拍这么靠前。从题目就知道这篇文章的贡献是提出了一个动态上采filter,替代了其他论文中的MC。10.1 网络结构这部分不是重点,大概看

2021-12-15 19:30:30 3671

原创 经典视频超分论文总结3

本次写一写清华大佬Takashi Isobe的三个超分作品,大佬一年内,而且好像还是在华为实习期间连续中了三篇顶会,代码都开源在他自己的github中。1、REVISITING TEMPORAL MODELING FOR VIDEO SUPER-RESOLUTION(RRN,BMCV2020)本文其实很像上篇提到的FRVSR,也是采用RNN做超分,不同之处在于引入了残差结构1.1 摘要1)作者认为做超分因为loss不同,所以直接比结果是无效的。(这点确实,l2 loss会明显提高psnr计算结果,但

2021-12-15 15:11:15 2886

原创 经典视频超分论文总结2

书接上回,咱继续写paperwithcode中VID4排行榜上的论文前面的论文可以查看地址经典视频超分论文总结1经典视频超分论文总结27、Detail-revealing Deep Video Super-resolution(DRDVSR, ICCV2017)港中文的工作,贾佳亚大佬背书,虽然有公开代码,但是直接使用pb文件,所以无法查看具体模型。即使把pb用tensorboard可视化出来也超级乱。推荐另一个torch复现的代码。7.1 先说一下动量估计(Motion Estimation

2021-12-14 10:16:49 3167

原创 NCCL无root权限编译安装

闲的蛋疼学学paddlepaddle,多gpu通信需要安装NCCL整体来说,这篇文章是ok的,我也不想重复造轮子。Linux下NCCL源码编译安装 - chenzhen0530 - 博客园NCCL(NVIDA Collective Communications Library)目的是为了实现Multi-GPU或Multi-node之间的通信; 有两种安装方式,一是具有root权限的安装https://www.cnblogs.com/chenzhen0530/p/13885258.html但是我在编译

2021-12-08 16:35:31 1488

原创 f-string前面补零到固定长度

众所周知,string可以通过zfill进行补零,比如a = '23'a = a.zfill(5) # a 此时补零为 '00023'python3.6中的f-string可通过以下方式补零a = 23a = f'{a:05d}' # a 此时补零为 '00023'

2021-11-08 17:49:27 4441

原创 ubuntu下ffmpeg及VMAF的安装及使用

1 ffmpeg安装无论是有权限的大佬,还是我这种没有权限的渣渣。我全部推荐直接解压release版本的安装方法。最新的ffmpeg版本已经包括了libvmaf其他的各种编译或者用权限安装的,我都试过,最后还是发现直接解压release版本太方便了1.1 下载release包下载地址:https://johnvansickle.com/ffmpeg/我使用的ubantu18下载的是里面的 ffmpeg-release-amd64-static.tar.xz 。建议翻墙下载,不然速度以K计算1.2

2021-11-08 17:38:44 3164

原创 经典视频超分论文总结1

本文总结一下PaperWithCode中VID4榜上的几篇超分论文。1、Bidirectional Recurrent Convolutional Networks for Multi-Frame Super-Resolution(BRCN, NeurIPS 2015)https://proceedings.neurips.cc/paper/2015/file/c45147dee729311ef5b5c3003946c48f-Paper.pdfhttps://proceedings.neurips.cc

2021-10-22 18:47:11 1575

原创 pytorch加载模型错误 RuntimeError: Error(s) in loading state_dict for Model: Missing key(s) in state_dict

闲的没事,写写模型加载。模型在保存时侯以键对值保存,同时在加载时根据现在网络的键值查找模型对应的键值,然后加载。一般报错是因为模型和网络的键值不匹配。1、最常见的问题是键值多了或者少了 module.此种情况是模型在DataParallel或者DDP训练后保存的键值有module.,对应的网络的键值则没有module.1)可以通过:model = nn.DataParallel(model)将模型的键值加上module.2) 也可以通过遍历模型的键对值修改键值。 如:...

2021-10-14 20:03:55 6134

原创 zero-shot基础入门

好早前看了一下zero-shot的文章,并进行整理做成了PPT,今天上班有空分享一下。每张PPT下都有链接,更详细的介绍可以查看链接。1、定义这是zero-shot介绍时常用的一张图,从见过的类别(第一列)中提取特征(如:外形像马、条纹、黑白),然后根据对未知类别特征的描述,测试未见过的类别。...

2021-10-09 17:06:11 15822

原创 pip安装包成功后无法import

一般是安装的环境和python环境不同导致的。说一下我遇到的几种情况,有些我也搞不懂原因,希望抛砖引玉,各位可以一起分析。1、使用了sudo pip这是我刚遇到的,我zz的把虚拟环境放在/usr/bin 下,导致安装需要添加sudo,但是sudo pip 默认安装在系统自带的python下。举个例子,假如我虚拟环境是python3.6,系统自带的是python2.7。即使此时已经进入了虚拟环境,我使用sudo python 依旧是python2.72、conda进入其他python这

2021-10-09 15:41:04 4946 1

原创 img = img[..., None] 作用

对数组在最后增加一个维度如:原img shape为[256,256]经过该操作后shape为[256,256,1]同理,将None放在其他位置时在对应维度增加

2021-09-13 17:38:19 1877

原创 TypeError: Can‘t convert object of type ‘PosixPath‘ to ‘str‘ for ‘filename‘

使用pathlib.Path 确实爽, 路径行变短许多。但执行下面代码时,一不小心遇到上出问题from pathlib import Pathself.gt_root = Path(opt['dataroot_gt']) img_gt_path = self.gt_root/key/'img{}.png'.format(i)img_bytes = cv2.imread(img_gt_path)因为img_gt_path此时是一个pathlib.Path对象。img_

2021-08-30 16:01:34 12071

原创 numpy array转tensor

1、torch.tensor(data,*,dtype=None,device=None,requires_grad=False,pin_memory=False) 最推荐数据类型:和输入相同,可以使用dtype改变数据类型拷贝类型:总是深拷贝; 如果数据为tensor,不想拷贝,使用torch.Tensor.requires_grad_()ortorch.Tensor.detach()具体参考:https://pytorch.org/docs/stable/gener...

2021-08-27 11:26:07 7885

原创 血泪安装DCNv2 编译BasicSR框架下的DCNv2

源代码链接:https://github.com/xinntao/EDVR1、环境介绍我开始以为环境版本很重要,网上教程、github分析都在提供各种python、torch等匹配,但是经过我这四天血泪调试,现在发现版本是什么不重要。不同版本互相匹配很重要。这篇文写之前我终于在RTX3090 + python3.6 + torch1.7.1 及 RTX2080 + python3.6 + torch1.4.1均编译成功。2、先说结论1)pytorch 即使是相同的版本,下载时的cuda.

2021-08-13 11:39:40 5771 3

原创 glob匹配多级目录

今天发现一个glob神奇的功能,可以匹配多级目录,记录一下。比如目录等级为:root├── fileA| |———pagA1| |——pic1.png| |——pic2.png| |———pagA2| |——pic3.png| |——pic4.png|├── fileB| |———pagB1| |——pic1.png| |——pic2.png| |——pic3.png之前我

2021-08-10 15:44:45 1606

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除