_Suraimu_-CSDN博客

原创从 iPhone 人像模式导出深度图（视差图）

拍照前进入“设置-相机-格式”，将“相机拍摄”调整为“兼容性最佳”，否则之后拍摄的图无法导出深度图。

2023-10-10 04:34:49 1966 5

原创 Word 一页多张浮动型（文字环绕）图片/表格自动编号的顺序问题

在 Word 中某一页插入多张浮动型（文字环绕）图片或表格并自动编号时，经常会出现编号顺序错误，如下图中下方的表编号比上方的表编号要小。这是因为两张表的对象位置（锚点）处在同一个行文字上，因此两者的顺序是不确定的，而这个顺序和我们调整表格位置的操作顺序有关。一般情况下，我们都是先调上方表格位置，再调下方表格位置，若此时更新编号的域代码，会发现顺序错误。这时只需要再略微调整上方表格的位置并更新域代码，问题就解决了。

2023-04-18 18:47:23 782

原创 torch.gather() 函数理解

本文介绍了如何快速理解并使用 PyTorch 中的 torch.gather() 函数

2022-11-29 00:34:36 641

原创解决 bypy 授权失败问题

bypy 是一个非常方便的工具，能够直接把服务器的大文件（如数据集）上传至百度网盘中，用于备份，分享，或是从百度网盘中下载文件至本地。但是，官方版本使用 server 授权，经常出现“”的情况，导致无法正常使用。为了解决该问题，我们可以选择在本地进行授权，下面介绍详细的操作步骤。......

2022-08-30 15:11:55 3518 1

原创论文实验图片局部放大工具（可批量操作）

在写学术论文时，我们经常会需要对实验效果图片进行局部放大，从而突出和其他方法结果的差异。一般大家的做法可能是在 PPT 上一张一张的去画，但这种方法耗时耗力，而且很难保证所有图片放大区域的位置大小完全相同。为了方便之后画图，我用 Python 的 PyQt5 包制作了一个交互式的小工具，在这里也分享给大家。...

2022-08-10 18:28:25 4256 7

原创 Pytorch 模型中定义常量参数

有时候我们在模型中需要定义一些常量参数，比如自定义高斯模糊核的weight。我们希望在主函数中使用 .cuda() 将模型转到 gpu 上时，能够自动将常量参数也转到 gpu 上，但又不希望模型更新这些常量参数。为了达到这个目的，有两种实现方法：使用 nn.Parameter(xxx, requires_grad=False)class MyModel(nn.Module): def __init__(): super(MyModel, self).__init__() kernel =

2022-05-22 13:42:28 2174

原创论文 PPT 画图导出 PDF 注意事项

为了论文能通过 PDF eXpress 的检查，PPT 导出图片时选择另存为 Adobe PDF，PDF选项全部设置为空。之后可以使用 Adobe Acrobat 检查，具体做法：文件 -> 属性 -> 字体 -> 查看是否所有字体后面都标注了“已嵌入子集”，下面展示了一个失败案例。...

2022-03-18 16:19:15 1196

原创 Stereo Magnification: Learning view synthesis using multiplane images 论文笔记

1. 简介本文主要研究新视角合成任务中 Narrow-baseline Stereo Images Pairs（处于同一水平基线的左右视角图像）输入的情况。本文首次提出了 Multiplane Images (MPI) 的场景表达方式，其优点在于：只需用网络预测一次 MPI 的场景表达，后续就能重复利用该 MPI 来生成多个不同视角下的图片；能够有效获取未出现在 Stereo 输入图像中（被遮挡）的场景结构**。另外，为了训练网络，本文还提出了一种使用在线视频来生成训练数据的方法（不做介绍）。.

2022-02-07 22:09:41 1944

原创 PyTorch 使用 MaxPool 实现图像的膨胀和腐蚀

max_pool = nn.MaxPool2d(kernel_size=5, stride=1, padding=2) # 可调整 kernel_size 和 padding# 假设要处理的张量为 tensor# ===== 膨胀 =====tensor_dilate = max_pool(tensor)# ===== 腐蚀 =====tensor_erode = -max_pool(-tensor)

2022-01-13 14:43:51 3977

原创 Python 字典转对象（Dict to Object），用点来访问属性

在写一个项目的时候，有时需要读取配置文件（json，yaml 格式），通常读取后会存成字典（Dict）的形式，这种形式并不方便后续访问相关参数（代码不好看），因此我们希望能够将其更改为对象（Object），从而能直接使用点来访问相关参数。https://stackoverflow.com/questions/1305532/convert-nested-python-dict-to-object 上分享了非常多的解决方法，下面推荐我认为最好的。当然，如果有其他需求也可以参考上述链接，查看其他方法。&gt

2021-12-29 12:59:13 4451

原创 PyTorch 将 pretrained 模型从 3 通道改成 4（或更多）通道

针对不同的计算机视觉任务，当我们想使用预训练模型时，可能会存在模型输入通道不一致的情况，比如预训练模型的输入通常为 RGB 3 通道，而我们自己的任务通道数可能大于 3，这时就需要对预训练模型的结构进行更改，下方代码展示的则是其中一种更改方式：import torchvision.models as modelsimport torch.nn as nnbackbone = models.resnet18(pretrained=True)old_conv1 = backbone.conv1new_

2021-12-29 12:33:49 4442

原创使用 Tensorflow gpu 报错：Segmentation fault (core dumped)

Tensorflow，Cuda 以及 CuDNN 版本要匹配（如 tensorflow=1.15.0，cuda=10.0，cudnn=7.6.5），并配置 Cuda 的环境变量或设置软链接。相关资料：Segmentation fault (core dumped) on tf.Session()After I upgrade CuDNN library to 7.3.1 (which is greater than 7.2.1), segmentation fault error disappeare

2021-09-12 00:27:36 1649

原创 ECCV 2020 Best Paper: RAFT 光流检测代码详解

RAFT: Recurrent All-Pairs Field Transforms for Optical Flow 是 2D 光流检测领域内里具有里程碑意义的一个工作。本文模型无论是性能效果，还是参数量、运行效率，相比之前 state-of-the-art 方法都有了很大的提升。github上放出的代码也写得非常清晰，为了方便更多小伙伴了解这篇工作，下面结合原文中画的模型图对主要代码进行解释。首先，简单介绍一下 RAFT 的整体框架。输入为连续的两帧图像，Feature Encoder（权值共享）提

2021-03-22 18:50:18 10374 36

原创 os.environ[‘CUDA_VISIBLE_DEVICES‘] 无法指定GPU问题

解决方法：import osimport torchos.environ['CUDA_VISIBLE_DEVICES'] = '0'调换代码顺序，修改成import osos.environ['CUDA_VISIBLE_DEVICES'] = '0'import torch

2020-12-17 10:52:44 5673 1

原创 OneNote 英文默认字体修改方法（2020.10)

1 方法描述OneNote 是一款非常好用的笔记软件，但是对中文的支持并不是很好，特别是对于英文默认字体的修改，不能通过简单的软件内部设置把 Calibri 字体更改为微软雅黑，这就导致我们经常在使用过程中，由于切换输入法导致数字、字母的字体发生变化，影响整体的美观（逼死强迫症患者????）。在参考了众多博客方法后，我认为还是将 win10 默认的 Calibri 字体更改为微软雅黑最简单靠谱，下面介绍具体操作方法。方法分为精简版和完整版。2 操作步骤2.1 精简版考虑到大多数同学可能只想快速修

2020-10-09 20:41:18 14187 18

原创 Word中给公式加编号，编号右对齐方法

公式后添加 #(编号)，如y=kx+b#(1)键盘敲击回车

2020-02-27 16:07:13 1574

原创 Sublime Emmet 插件安装教程 & Tab 快捷键无法使用问题解决

在 Sublime 界面下键盘输入Ctrl+Shift+P，在跳出的输入框中输入Package Control: Install Package，接下来可能要等待一段时间，然后在跳出的输入框中输入 Emmet 并选择该插件下载安装。第一次下载可能会出现以下的错误提示，不用慌，按照上面步骤重新下载即可。下载完插件后会跳出一个信息界面，如下图。默认情况下，下载 Emmet 插件的同时会跟着一...

2020-02-23 21:04:01 1634 2

原创 SublimeLinter 配置 JS CSS HTML 语法检查（2020最新！！！）

1. 下载安装 Nodejs1.1. 官网下载官网地址 https://nodejs.org/en/download/1.2. 安装点击 msi 文件安装，详细安装过程可参考此博客。1.3. 测试在控制台下输入node -v和npm -v检测安装是否成功。2. npm 安装代码检查工具在控制台下依次输入以下命令安装 JavaScript、CSS 和 HTML 的代码检查工具（第三...

2020-02-19 16:14:07 319

原创 SteReFo: Efficient Image Refocusing with Stereo Vision 论文笔记

1. 介绍拍摄景深图像能够让人将注意力集中于图像中特定的目标，这项技术在专业和业余摄影者中广泛使用。为了拍摄出景深图像，往往需要有着高质量光学系统的单反相机（DSLR）来聚焦某个特定的深度平面，同时产生柔美的散焦（bokeh）效果。Busam、Hog 等人提出了一个基于物理的流程来模仿该效果，而输入是手机等设备拍摄的 all-in-focus 立体图像。在 KITTI 图像数据集上处理速度能达...

2020-02-15 16:06:39 555

原创 firefox每次打开提示“您必须先登录此网络才能访问互联网” 问题解决

在搜索地址栏输入about:config搜索 network.captive-portal-service.enabled，并将值设为false

2020-01-31 17:59:38 13888 6

原创 Ubuntu未发现WiFi适配器解决方法（联想y7000）

终端输入：rfkill list 查看信息sudo modprobe -r ideapad_laptop 可以上网了，但重启后再次不能上网sudo gedit /etc/modprobe.d/blacklist.conf 添加 blacklist ideapad_laptop 保存，大功告成！...

2019-10-31 22:27:20 3022 2

原创 Predicting Depth, Surface Normals and Semantic Labels with a Common Multi-Scale... 论文笔记

1. 论文介绍本文作者设计了一种通用的多尺度网络，仅需要通过少量的修改就能适用于三个不同的计算机视觉任务：深度估计，表面法向量估计，语义分割。给定输入图片，网络能够直接回归出输出图，如深度图、法向量图、分类图。网络结构在之前工作上加以改进，堆叠了 3 层卷积神经网络，从低分辨率逐渐升到高分辨率，进一步改善了图像细节。测试中，网络的输出是实时的，达到了 30Hz 左右，同时生成的结果在三项任务中都...

2019-10-29 20:02:31 860

原创 Depth Map Prediction from a Single Image using a Multi-Scale Deep Network 论文笔记

1. 摘要本文作者提出了一种多尺度的深度网络用来从单张图片估计深度图。该网络由两部分组成：一个全局粗糙网络以及一个局部细化网络。同时，作者还提出了一种尺度不变误差来估计深度关系。最终作者利用原始训练数据集在 NYU Depth 和 KITTI 数据集上获得了当前最佳性能。2. 介绍估计深度对于理解一个场景的几何信息是非常重要的，它能为目标和环境提供丰富的表达，从而有助于目标识别任务以及 3...

2019-10-28 23:57:12 563

原创 Monocular Relative Depth Perception with Web Stereo Data Supervision 论文笔记

1. 摘要本文中，作者引入了一种简单有效的方式用来从网上的立体图片自动生成密集的相对深度标注，并利用该方式构建了一个含有丰富图片及对应相对深度的数据集。同时，作者还提出了一种改进的 ranking loss 来处理不平衡的相对深度前后顺序关系，使网络能够关注难以判断相对深度关系的点对。实验结果显示，作者提出的方法不仅在自然场景图片相对深度预测上获得了当前最佳的精度，而且该方法也有助于其他基于密集...

2019-10-25 13:25:57 1228

原创 Single-Image Depth Perception in the Wild 论文笔记

1. 摘要这篇论文研究的是在无约束条件下从自然场景中的图片中恢复深度。Chen 等人提出了一种新的数据集 “Depth in the Wild”（DIW），其中包含了 495K 张图片，每张图片标注了一对随机的采样点以及它们的相对深度关系。同时，作者还提出了一种新的估计相对深度的算法（摘要中作者写的是估计绝对深度 metric depth，但我在看完论文后感觉应该是相对深度，因为估计的深度并不是...

2019-10-24 23:19:52 1441

原创论文 Copy-and-Paste Networks for Deep Video Inpainting 学习笔记

视频修复（video inpainting）视频修复相比图像修复增添了挑战：考虑额外的瞬时信息并保持瞬时相关性。作者设计了一个基于 DNN 的框架叫做 Copy-and-Paste 网络，该网络在进行视频修复时利用了视频中其他帧的信息。训练后的网络能够从参考帧中复制有用的像素点并填补目标帧中的空洞。网络还包括一个对齐网络用来计算不同帧之间的放射矩阵并对齐帧，使得网络能够利用与目标帧相隔较大...

2019-09-05 13:45:24 2503 1

原创利用时域（空域）卷积定理进行图像滤波（Matlab 实现）（二）

引言在利用时域（空域）卷积定理进行图像滤波（Matlab 实现）（一）中我们知道了傅里叶变换是满足时域（空域）卷积定理的，在从离散傅里叶变换到离散余弦变换 —— 公式证明中我们也看到了离散余弦变换实际上就是对经过对称平移后的图像进行的傅里叶变换，那么离散余弦变换是否也满足时域（空域）卷积定理呢，请看下文。满足 or 不满足？我们以二维空间的图像为例，列出其傅里叶变换的时域（空域）卷积定...

2019-08-17 20:52:02 2636 2

原创从离散傅里叶变换到离散余弦变换 —— 公式证明

首先我们列出离散傅里叶变换与离散余弦变换的公式：离散傅里叶变换正变换：F(u)=∑x=0Nf(x)e−j2πuxN, u=0,1, … ,N−1F(u)=\sum^{N}_{x=0}f(x)e^{-j2\pi\frac{ux}{N}},\ u=0,1,\ \dots\ ,N-1F(u)=x=0∑Nf(x)e−j2πNux, u=0,1,&nbs...

2019-08-16 21:48:50 6516

原创利用时域（空域）卷积定理进行图像滤波（Matlab 实现）（一）

时域卷积定理证明卷积定理：f(t)∗g(t)=∫−∞∞f(τ)g(t−τ)dτf(t) * g(t) = \int^{\infty}_{-\infty} f(\tau)g(t-\tau)d\tauf(t)∗g(t)=∫−∞∞f(τ)g(t−τ)dτ求傅里叶变换：F[f(t)∗g(t)]=∫−∞∞[∫−∞∞f(τ)g(t−τ)dτ]e−jwtdt 【交换积分顺序】=∫−∞∞f...

2019-08-15 19:35:30 4773 1

原创从傅里叶级数到傅里叶变换（连续、离散）—— 公式推导

傅里叶级数法国数学家傅里叶发现，任何周期函数都可以用正弦函数和余弦函数构成的无穷级数来表示。f(t)=a02+∑n=1∞[ancos(nw0t)+bnsin(nw0t)]f(t)=\frac{a_0}{2}+\sum_{n=1}^\infty \big[a_ncos(nw_0t)+b_nsin(nw_0t)\big]f(t)=2a0+n=1∑∞[ancos(nw0t)+bnsi...

2019-08-15 13:01:06 13418 7

原创论文 GP-GAN: Towards Realistic High-Resolution Image Blending 学习笔记

1. 模型简介本文中，作者提出了一种方法，能在给定简单的复制粘贴合成图像（composited copy-and-paste）的情况下，生成高分辨率、且比较真实的融合图像。文章的亮点在于作者将传统的基于梯度的方法与最近出来的 GAN 结合起来，达到生成高分辨率融合图像的目的，这也是 GAN 被用在此领域的第一篇文章。具体要实现的任务如下图：（a）图是复制粘贴后的原始合成图像，红线框出来的部...

2019-08-03 21:21:21 3542

原创论文 Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks ( CycleGAN ) 学习笔记

1. 模型简介在之前 pix2pix 论文中，作者已经很好地解决了训练集中有匹配对的图像风格转换问题，本文讨论的是对于训练集中不存在图像匹配对（寻找到匹配的图像数据集成本非常高）的情况下，如何能够较好地实现图像的风格转换。若使用简单的单一映射 G:X→YG:X \to YG:X→Y，输入图像经过生成器转换为输出图像 y^=G(x),x∈X\hat y=G(x), x \in Xy^=G(x)...

2019-08-03 12:43:18 436 2

原创论文 Image-to-Image Translation with Conditional Adversarial Networks ( pix2pix ) 学习笔记

作者提出的条件生成对抗网络是一种解决图像风格转换（image-to-image translation）问题的通用方法。网络不仅学到了从输入图片到输出图片的映射，同时还学到了促成这种映射关系的损失函数。相比传统方法，作者方法对于不同风格图像的转换无需采用不同的损失函数，因此其通用性是这篇文章的亮点所在。作者还指出在发行了相关的 pix2pix软件后，大量的网络使用者，包括一些艺术家都在上面进行了...

2019-08-02 18:27:17 374

原创论文 Generative Adversarial Nets ( GAN ) 学习笔记

1. 模型的提出在深度学习中，我们希望寻找到一种模型能够在学习大量已有数据后，生成符合自然图片、声音的概率分布（probability distributions），即通过机器产生出以假乱真的图片、声音信号。到目前为止，我们在判别模型（discriminative model）领域已经取得了良好的效果，能够将高维的原始信息转换为类别信息。然而，在生成模型（generative model）领域中...

2019-08-02 12:49:45 289

原创使用 tensorboard

安装 TensorFlow（不安装也可以，但是等会第3步命令行输入命令后会出现提示：TensorFlow installation not found - running with reduced feature set.)，建议安装 CPU-Only 版本，使用命令：pip install tensorflow，若网速慢，可使用清华软件源，具体步骤自行百度。安装 tensorboard：pi...

2019-08-01 16:42:40 7888 2

原创 Anaconda中Spyder更新问题解决

在安装的Anaconda 2019.03中自带有3.3.3版本的Spyder，打开Spyder，软件会自动检查更新。当前最新版本是4.0.0 beta3，更新提示会告诉你有3.3.5的版本，并提供更新方法的网址。在 Anaconda Prompt 中输入上面2行命令。我自己第1行命令可以顺利执行，但执行第2条命令时会出现 Solving environment: Failed 问题。如果有出现...

2019-07-07 03:31:21 14356 7

原创 Sublime Text 3 插件 SublimeREPL 无法运行IPython 解决方法

47/100发布文章博文管理我的博客退出 Trash Temp Sublime Text 3 插件 SublimeREPL 无法运行 IPython 解决方法添加摘要 # Sublime Text 3 插件 SublimeREPL 无法运行 IPython 解决方法一般情况下，Sublime Text...

2019-03-16 13:07:55 5815

qq_39546227的博客