是暮涯啊-CSDN博客

原创谈谈哲学～

晚上日常听王德峰讲哲学，闲着没事做点摘要总结。1、儒道互补儒家讲求入世，道家讲求出世。因此庄子说：相濡以沫，不如相忘于江湖。中国知识分子讲求经世致用，但当世道不允许时候，他们不至于走极端，而追求道家提倡的出世。如陶渊明、魏晋时期的竹林七贤2、中西追求中国传统追求安心立命。中国人认为人是在君臣、父子、兄弟、夫妇、朋友五种人伦关系之中，西方讲究追求个人的自我价值实现。我认为，虽然表面上来看中国人活得更累，因为要为周围人活着，西方却可以活的自我，这确实也是现在很多年轻人的想法。但在我国向西方学习的

2021-10-14 15:57:03 411

原创大模型创业项目寻求合伙人

目前我们已经有前端、后端、推广、产品等方向，并已经完成第一阶段开发，正在进行第二阶段社区开发。1）通过封装的大模型平台，将大模型使用门槛降到最低，对标toC的huggingface。但我们仍需要前端（vue）、客户端（react）、后端（java）等开发人员。我们是一个包含20多个985，211的大模型创业团队，2）打造无边界无虚实的虚拟人图文社区。我们的愿景是将大模型带给更多人。

2024-06-03 23:59:04 489

原创部署个人静态网站到阿里云服务器（含域名解析）

总结部署个人网站到服务器的教程

2023-10-15 17:50:47 1304

原创 ERROR: Could not build wheels for opencv-python which use PEP 517 and cannot be installed d

Python3.6适配的opencv版本是opencv-python 4.5.4.60。第一种可能性当然是更新setuptools。就是python和opencv版本不匹配。

2023-09-26 11:16:28 3682 3

原创 A Simple Baseline for Video Restoration with Grouped Spatial-temporal Shift（ShiftNet）

视频修复旨在从降质的视频中恢复清晰的帧，具有许多重要的应用。。然而，现有的深度学习方法往往依赖于复杂的网络架构，如光流估计、可变形卷积和跨帧自注意层，导致计算成本高。在这项研究中，我们提出了一个简单而有效的视频修复框架。我们的方法基于分组空间时间位移（grouped spatial-temporal shift），这是一种轻量级和直观的技术，可以。通过引入分组空间位移，我们获。结合基本的2D卷积，这个简单的框架可以有效地聚合帧间信息。

2023-09-13 23:08:54 1047

原创 Activating More Pixels in Image Super-Resolution Transformer（HAT）超分

基于Transformer的方法在低级视觉任务（如图像超分辨率）上表现出令人印象深刻的性能。然而，我们发现这些网络只能通过归因分析利用有限的输入信息空间范围。这意味着Transformer的潜力在现有网络中仍未得到充分利用。为了激活更多输入像素以获得更好的重构效果，我们提出了一种新颖的混合注意力Transformer（Hybrid Attention Transformer，HAT）。它结合了通道注意力和基于窗口的自注意力方案，从而利用全局统计和强大的局部拟合能力。

2023-09-13 22:43:04 1137

原创 CVPR2023 Deblur论文整理

Paper list 来自 https://github.com/DarrenPan/Awesome-CVPR2023-Low-Level-Vision#image-deblurring简单用GPT翻译一下摘要。

2023-08-31 22:25:31 3140

原创 undefined symbol: _ZN2at5sliceERKNS_6TensorElN3c108optionalIlEES5_l

安装mmcv报错

2023-08-09 16:09:16 771

原创 ImportError: /lib/x86_64-linux-gnu/libstdc++.so.6: version `GLIBCXX_3.4.29‘ not found

如果是import matplotlib 遇到该问题，就采用如下代码重装matplotlib。如果是import skimage 遇到该问题，就采用。

2023-07-31 19:56:19 356

原创统计神经网络参数量、MAC、FLOPs等信息

通过stat、thop、fvcore等工具统计常见CNN，Transformer的参数量，Mac，flops等信息

2023-07-27 23:27:14 2045

原创 ImportError: libgthread-2.0.so.0: cannot open shared object file: No such file or directory

安装cv2遇到库缺失问题

2023-06-29 10:58:46 856

原创图像评价指标IE， NIE

单独介绍一下图像评价指标 IE和NIE。

2023-06-01 22:33:04 836

原创 C++调用libtorch1.12遇到的几个问题

c++调用libtorch遇到的常见问题

2022-10-19 16:28:14 2289 5

原创中值滤波，均值滤波，高斯滤波，双边滤波，联合双边滤波介绍

看GAMES202相关课程发现闫老师讲的太好了，所以记录一下。当然文中涉及的PPT也来自闫老师的课程PPT，欢迎交流。首先这几种都是空域的滤波方式，用于抑制图像中的噪声。它们采用的原理基本都是通过滤波核K处理含噪图像C，得到干净的输出图C。滤波核：在处理图像位于坐标 i 处的值时，需要考虑其周围j个位置的坐标（包含i本身）。这j个相邻位置即为滤波核。图像的边缘一般像素变化大，包含高频信号；图像中连续部分像素间差距小，一般是低频信号。...

2022-08-28 14:42:33 6403 1

原创插帧中grid_sample函数详解

MEMC,VSR 常用的warp操作中grid_sample函数

2022-07-31 15:03:04 3559 1

原创深度学习MEMC插帧论文列表paper list

整理一下深度学习用于运动估计和运动补偿的论文列表。大致按照内容与时间区分。鉴于工作量太大，而且MEMC这块点击量很少，就不介绍文章内容了。

2022-07-24 15:55:28 2775

原创深度学习图像数据增强

作为cv的基础，数据增扩是很重要的一环。一般来说主要有以下几种：1、通过openCV操作 2、使用torchvision.transform 3、使用torchvision.transform.function 4、使用nvidia.dali 5、albumentations库。对应的数据也一般可以分为1、单图处理，如分类。2、同尺寸多个数据处理，如分割，去噪。3、不同尺寸多个数据处理，如超分。下面将按照方法简单总结一下。几何变换旋转，缩放，翻转，裁剪，平移，仿射变换色彩空间亮度，对比度，饱和度，

2022-06-07 10:32:09 1197 1

原创光流估计中cost volume详解

原创声明：是暮涯啊我认为之所以光流估计中会使用独有的cost volume，其初始形态是传统基于块的光流估计方法中，对每个前一帧图像F1中的某个块B1，计算其在一定范围内对应于后一帧图像2中哪个块B2最接近。假如B1的坐标为（x1，y1）B2的坐标为（x2，y2），对应这个块的光流矢量就是（x2-x1，y2-y1）。1、FlowNet中的correlation1.1 介绍FlowNet作为光流估计的开山鼻祖，对correlation的计算花了大量篇幅。作者说这些分割啊，深度估计啊这些网络可以产生像素

2022-05-12 18:02:31 6018 2

原创运动估计运动补偿（Motion estimation and motion compensation，MEMC）入门总结

本文不生产内容，本文制作内容的搬运工，希望通过本文系统性的整理，能够让您对该领域具有整体的认识。认准原创文章将按照以下目录展开：

2022-04-28 15:31:12 8521

原创 ISP论文整理2

上一篇是整理了一些顶会顶刊的AI ISP论文，这里整理一些workshop或者arxiv之类的论文。7、Deep Camera: A Fully Convolutional Neural Network for Image Signal Processin（ICCVW19）论文被引20说这个传统分阶段ISP会把每个步骤的loss累加并降低最终图像质量。因此用全卷积网络替代缺陷像素校正、去噪、白平衡、曝光校正、去马赛克、颜色变换和伽马编码（defect pixel correction, denois

2022-04-13 11:47:01 5508 1

原创 ISP论文整理1

我又转到ISP来看论文啦，鉴于之前博客经常被抄，我要先写个原创声明。本文为是暮涯啊在CSDN创作，认准原创地址未经允许，请勿转载。

2022-04-11 16:20:06 6008 1

原创去噪论文整理总结

记录一些去噪领域的顶会论文1、Image denoising by sparse 3-d transform-domain collaborative filtering（BM3D，TIP2007）论文引用7000+翻译代码讲解2、Weighted nuclear norm minimization with application to image（WNNM，CVPR2014）论文被引1400+3、From Learning Models of Natural Image Patch

2022-04-05 18:01:40 9091 1

原创 Transformer用于超分辨率重建

记录几篇Transformer的超分辨率重建论文。1 Learning Texture Transformer Network for Image Super-Resolution（TTSR， CVPR2020）本文引用已经有200多了。原文链接1.1 摘要文章做的是RefSR工作，主要观点是将Transformer作为一个attention，这样可以更好地将参考图像（Ref）的纹理信息转移到高质图像（HR）中。做法还是比较有意思的，如下图所示，将上采样的LR图像、依次向下/上采样的Ref图像、原

2022-04-01 09:41:58 15716

原创 linux xorg占用显存过大

问题要治标更要治本好吧这个问题的根本原因是电脑使用独显作为显示输出，解决方法当然是使用集显作为显示输出，独显单独用来cuda运算。所以很多教程Ctrl+Alt+F1进入文本模式，再用Ctrl+Alt+F7回来看，xorg占用的显存变小了。这只是治标，因为进入文本模式回来很多图形化界面都关了呀，所以暂时变小了。后面使用如果打开还是会继续占用的。解决方案是啥，重装显卡驱动，把图形化界面放到集显去。集体教程看台式机ubuntu，使用intel核显作显示输出，nvidia独显做cuda运算_feyn

2022-03-03 20:31:01 3918

原创 ffmpeg生成的视频与QuickTime不兼容

问题描述在使用图片生成视频命令ffmpeg -r 25 -f image2 -s 3840x2160 -i pic/%05d.png -vcodec libx265 -crf 25 -pix_fmt yuv420p out.mp4 -y生成h265编码的视频，但是无法在QuickTIme直接播放，显示不兼容。解决方法：1、使用命令将该视频进行转换ffmpeg -i out.mp4 -c:v libx265 -vtag hvc1 output.mp4重点在于 -vtag hvc1 这个命令

2022-02-09 09:53:59 4575

原创经典超分论文总结5

继续膜拜xintao wang大佬，大佬到了腾讯后更是杀疯了，之前在港中文中的两篇worshop被引爆炸，现在要中就中正刊。本文介绍最新的GFPGAN和Real-ESRGAN，都是SISR和盲超分。4、GFPGAN：Towards Real-World Blind Face Restoration with Generative Facial Prior (CVPR 2021)本篇论文专著于人脸的超分，效果我愿称之为最强。话不多说，先上张对比看看4.1 摘要盲超分通常需要脸部先验（脸部几何先验或参

2021-12-21 15:57:55 3053

原创经典视频超分论文总结4

继续看论文，感觉头发都要掉完了，哭==这次写paperWithCode上vid4榜首的两篇论文10 Deep Video Super-Resolution Network Using Dynamic Upsampling Filters Without Explicit Motion Compensation（VSR-DUF， CVPR18）震惊，18的论文能效果拍这么靠前。从题目就知道这篇文章的贡献是提出了一个动态上采filter，替代了其他论文中的MC。10.1 网络结构这部分不是重点，大概看

2021-12-15 19:30:30 3907

原创经典视频超分论文总结3

本次写一写清华大佬Takashi Isobe的三个超分作品，大佬一年内，而且好像还是在华为实习期间连续中了三篇顶会，代码都开源在他自己的github中。1、REVISITING TEMPORAL MODELING FOR VIDEO SUPER-RESOLUTION（RRN，BMCV2020）本文其实很像上篇提到的FRVSR，也是采用RNN做超分，不同之处在于引入了残差结构1.1 摘要1）作者认为做超分因为loss不同，所以直接比结果是无效的。（这点确实，l2 loss会明显提高psnr计算结果，但

2021-12-15 15:11:15 3254

原创经典视频超分论文总结2

书接上回，咱继续写paperwithcode中VID4排行榜上的论文前面的论文可以查看地址经典视频超分论文总结1经典视频超分论文总结27、Detail-revealing Deep Video Super-resolution(DRDVSR, ICCV2017)港中文的工作，贾佳亚大佬背书，虽然有公开代码，但是直接使用pb文件，所以无法查看具体模型。即使把pb用tensorboard可视化出来也超级乱。推荐另一个torch复现的代码。7.1 先说一下动量估计（Motion Estimation

2021-12-14 10:16:49 3448

原创 NCCL无root权限编译安装

闲的蛋疼学学paddlepaddle，多gpu通信需要安装NCCL整体来说，这篇文章是ok的，我也不想重复造轮子。Linux下NCCL源码编译安装 - chenzhen0530 - 博客园NCCL（NVIDA Collective Communications Library）目的是为了实现Multi-GPU或Multi-node之间的通信；有两种安装方式，一是具有root权限的安装https://www.cnblogs.com/chenzhen0530/p/13885258.html但是我在编译

2021-12-08 16:35:31 2181

原创 f-string前面补零到固定长度

众所周知，string可以通过zfill进行补零，比如a = '23'a = a.zfill(5) # a 此时补零为 '00023'python3.6中的f-string可通过以下方式补零a = 23a = f'{a:05d}' # a 此时补零为 '00023'

2021-11-08 17:49:27 7371

原创 ubuntu下ffmpeg及VMAF的安装及使用

1 ffmpeg安装无论是有权限的大佬，还是我这种没有权限的渣渣。我全部推荐直接解压release版本的安装方法。最新的ffmpeg版本已经包括了libvmaf其他的各种编译或者用权限安装的，我都试过，最后还是发现直接解压release版本太方便了1.1 下载release包下载地址：https://johnvansickle.com/ffmpeg/我使用的ubantu18下载的是里面的 ffmpeg-release-amd64-static.tar.xz 。建议翻墙下载，不然速度以K计算1.2

2021-11-08 17:38:44 3649

原创经典视频超分论文总结1

本文总结一下PaperWithCode中VID4榜上的几篇超分论文。1、Bidirectional Recurrent Convolutional Networks for Multi-Frame Super-Resolution（BRCN， NeurIPS 2015）https://proceedings.neurips.cc/paper/2015/file/c45147dee729311ef5b5c3003946c48f-Paper.pdfhttps://proceedings.neurips.cc

2021-10-22 18:47:11 2055

空空如也

空空如也