计算机视觉
文章平均质量分 69
计算机视觉の学习之旅
Polaris_T
失败总是贯穿人生的始终,这就是常态。
展开
-
一行文本生成4D动态场景——Meta AI MAV3D论文解读
一行文本生成4D动态场景——Meta AI MAV3D论文解读原创 2023-03-21 16:36:36 · 727 阅读 · 0 评论 -
NeRF与GAN的交融(一)——NeRF论文阅读
原因:如果是仅仅固定地采用每个小区间的端点或者中点作为该区间的代表值,那么即使视角无限多,每个视角拍摄的图片也无限多,所利用的也仅仅是三维空间中固定的那些离散点(导致优化时只优化有限个固定点,而其他位置处的点均未学到场景的3D特征),并不能充分利用三维空间信息,即丧失了NeRF是连续空间表征的特点。合理的积分离散化采样:通过更高效的采样策略减小估算积分式的计算开销,加快训练速度,并且保证空间的中的绝大多数点都能被优化到,而非只优化某些固定的点(若使用每个小区间的左端点作为代表点的话)。原创 2023-01-10 10:53:53 · 963 阅读 · 2 评论 -
解决pytorch报错——RuntimeError: Expected to have finished reduction in the prior iteration...
解决pytorch报错——RuntimeError: Expected to have finished reduction in the prior iteration before starting a new one. This error indicates that your module has parameters that were not used in producing loss. You can enable unused parameter detection by (1) pas原创 2023-01-05 10:22:31 · 21687 阅读 · 20 评论 -
近两年激光雷达运动物体分割论文阅读小结
点云数据表达形式LMNet 4DMOS RVMOS主体网络架构LMNet 4DMOS RVMOS点云数据表达形式的优缺点基于点的方法可以从无序的点云中提取有效的特征,但是它们很难有效地扩展到大规模的点云数据基于稀疏体素卷积的方法可以减少点云的计算负担,但体素化会引入信息损失基于RangeIamge的方法是一个相对轻量级的中间表示,然而,在将其back-projection回3D点云时,存在边界模糊问题突出的指标提升tricks LMNet检测精度对比推理速度对比结语。......原创 2022-07-29 21:07:29 · 1889 阅读 · 1 评论 -
激光雷达点云语义分割论文阅读小结
点云数据一般是由激光雷达等3D扫描设备获取的空间若干点的信息,一般包括(X,Y,Z)位置信息、RGB颜色信息和强度信息等,是一种多维度的复杂数据集合。相比于2D图像来说,3D点云数据可以提供丰富的几何、形状和尺度信息,不易受光照强度变化和其它物体遮挡的影响。点云可以通过四种主要技术获得:基于不同原理获取的点云数据,其数据的表示特征和应用的范围也各不相同。激光雷达(LiDAR)点云数据,是由三维激光雷达设备扫描得到的空间点的数据集,每一个点都包含了X、Y、Z三维坐标信息,有的还包含颜色信息、反射强度信息、回波原创 2022-07-29 20:40:21 · 2286 阅读 · 0 评论 -
计算机视觉大作业:EdgeConnect论文阅读
在本文中,作者提出了一个由两个阶段构成的图象复原网络:第一个阶段是一个边缘生成网络,第二个阶段是一个图像补全网络,并且这两个网络都采用了生成式对抗网络(GAN)的思想。边缘生成网络只关注生成缺失区域中的假想边缘轮廓,而图像补全网络利用轮廓假想图以及输入的不完整图片,对缺失区域的RGB像素数值进行估计,最终生成复原完毕的图像。记G_1为边缘生成网络的生成器和该生成器对应的函数映射,D_1为边缘生成网络的判别器和该判别器对应的函数映射,同理,记G_2,D_2 分别为图像补全网络的生成器及判别器。........原创 2022-06-27 11:17:38 · 4246 阅读 · 14 评论 -
CV第四次上机 利用双目图像计算深度图
双目立体匹配一直是双目视觉的研究热点,双目相机拍摄同一场景的左、右两幅视点图像,运用立体匹配匹配算法获取视差图,进而获取深度图。而深度图的应用范围非常广泛,由于其能够记录场景中物体距离摄像机的距离,可以用以测量、三维重建、以及虚拟视点的合成等。若想自己尝试拍摄双目图片进行立体匹配,获取深度图,进而进行三维重建等操作,要做的工作可以使用以下几个步骤简要概括:对于本实验而言,我们已经获得了老师给出的相机标定后的相关参数,且双目图像已经经过了矫正,因此我们可以直接在这两幅图像的基础上调用Matlab的...原创 2022-06-27 11:08:18 · 4302 阅读 · 0 评论 -
CV第三次上机 Pytorch+LeNet-5实现手写数字识别
Pytorch+LeNet-5实现手写数字识别。正是开始于LeNet5网络的提出,并成功应用于手写体识别。同时,卷积神经网络在语音识别、物体检测、人脸识别等应用领域的研究也逐渐开展起来。原创 2022-06-27 10:47:06 · 4697 阅读 · 4 评论 -
西电计科计算机视觉期末复习笔记
本人西电19计科,CV期末90+,这是复习期间整理的笔记,基本涵盖了课程全部重点,有需要的学弟学妹可以在复习的时候参考一下。原创 2022-03-26 09:46:11 · 7437 阅读 · 3 评论 -
Python+OpenCV实现基于金字塔的图像融合
一、背景有关高斯金字塔、拉普拉斯金字塔的相关背景知识可以参考OpenCV之图像金字塔与图像融合二、图像融合图像金字塔一个典型的应用就是图像融合。图像融合的实现步骤为:读入两幅大小相同的图像 img1 img2;构建 img1 img2的 高斯金字塔,层数根据需要设定(本实验为7层);根据高斯金字塔和拉普拉斯金字塔的关系,推出拉普拉斯金字塔的Li(也为7层,第一层大小和原图相同);在拉普拉斯图层的每一层进行图像融合;根据融合后的图像金字塔重建原始图像。三、Python+OpenCV实现原创 2022-01-22 15:48:30 · 6679 阅读 · 0 评论 -
Matlab实现计算机视觉中的基本图像变换
本文用matlab实现了计算机视觉中的6大基础图像变换操作,包括:1. 水平、垂直镜像2. 图像缩放3. 平移4. 旋转5. 仿射6. 透视clear;close all;img = imread('C:\Users\HP\Desktop\lena.bmp');[m,n] = size(img);subplot(1,3,1);imshow(img);title('原始图像');% -----------------水平镜像-----------------sp_mirror原创 2022-01-22 15:33:08 · 3753 阅读 · 0 评论 -
李沐d2l《动手学深度学习》第二版——风格迁移源码详解
本文是对李沐Dive to DL《动手学深度学习》第二版13.12节风格迁移的源码详解,整体由Jupyter+VSCode完成,几乎所有重要代码均给出了注释,一看就懂。需要的同学可以在文末链接处下载原文件。话不多说,我们开始。图1中的内容图像为本书作者在西雅图郊区的雷尼尔山国家公园拍摄的风景照,而风格图像则是一幅主题为秋天橡树的油画。最终输出的合成图像应用了风格图像的油画笔触让整体颜色更加鲜艳,同时保留了内容图像中物体主体的形状。图1 风格迁移效果示意图 1.一种简单的风格迁移方法(1) 初始原创 2022-01-21 14:29:58 · 7061 阅读 · 6 评论 -
空洞卷积(Dilated Convolution)简介
一、空洞卷积(Dilated Convolution)Dilated Convolution(空洞卷积/膨胀卷积)是在标准的 convolution map 里注入空洞,以此来扩大感受野。膨胀卷积与普通的卷积相比:除了卷积核的大小以外,还有一个扩张率(dilation rate)参数,主要用来表示膨胀的大小。在普通卷积中,可以认为它的dilated rate = 1。感受野(receptive field):CNN中,某一层输出结果中一个元素所对应的输入层的区域大小,感受野是卷积核在图像上看到的大小,例原创 2021-11-20 14:52:54 · 8618 阅读 · 10 评论 -
Matlab实现SIFT+RANSAC特征检测与图像融合
一、SIFT特征检测尺度不变特征转换(Scale-invariant Feature Transform or SIFT)是一种计算机视觉的算法,用来侦测与描述影像中的局部性特征。该算法在空间尺度中寻找极值点,并提取出其位置、尺度、旋转不变量,此算法由David Lowe在1999年所发表,2004年完善总结。SIFT算法具有较好的稳定性和不变性,能够适应旋转、尺度缩放、亮度的变化,能在一定程度上不受视角变化、仿射变换、噪声的干扰。SIFT算法的大致步骤如下:建立尺度空间,即建立高斯差分(DoG)金原创 2021-11-19 16:52:56 · 11798 阅读 · 26 评论 -
Matlab实现sift特征检测+图像拼接
Matlab实现sift特征检测+图像拼接共有12个m文件,其中main为主程序,点击运行即可。一、部分代码示例close all;clear;clc;im1=imread('test3.png');im2=imread('test4.png'); gray1=img2gray(im1);gray2=img2gray(im2); [des1,loc1]=sift(gray1);[des2,loc2]=sift(gray2); figure;drawPoints(im1,loc原创 2021-10-23 20:29:57 · 7511 阅读 · 14 评论 -
Matlab实现sift特征检测和两幅图像的特征点匹配(D. Lowe)
一、sift算法简介尺度不变特征转换(Scale-invariant feature transform或SIFT)是一种电脑视觉的算法用来侦测与描述影像中的局部性特征,它在空间尺度中寻找极值点,并提取出其位置、尺度、旋转不变量,此算法由 David Lowe在1999年所发表,2004年完善总结。其应用范围包含物体辨识、机器人地图感知与导航、影像缝合、3D模型建立、手势辨识、影像追踪和动作比对。SIFT算法的特点有:SIFT特征是图像的局部特征,其对旋转、尺度缩放、亮度变化保持不变性,对视角变原创 2021-10-23 11:07:35 · 20479 阅读 · 19 评论 -
Matlab实现Harris角点检测
一、代码close all;clc;% 读取图像信息(原图为灰度图)img = imread('lena.bmp');[m,n] = size(img);% 先在原图外围扩展一圈tmp = zeros(m+2,n+2);tmp(2:m+1,2:n+1) = img;% 初始化各一阶偏导矩阵Ix = zeros(m+2,n+2);Iy = zeros(m+2,n+2);E = zeros(m+2,n+2);% 求偏导Ix(:,2:n) = tmp(:,3:n+1) - tmp(:,原创 2021-10-23 10:13:15 · 5644 阅读 · 5 评论 -
Canny边缘检测Step4——双阈值检测&边缘连接
一、背景知识 经过Canny边缘检测的前三步:Canny边缘检测Step1——二维高斯滤波Canny边缘检测Step2——Sobel算子计算梯度信息Canny边缘检测Step3——梯度幅值的非极大值抑制(NMS)详解 我们已经到了最后一步——双阈值检测&边缘连接 双阈值检测&边缘连接算法比较简单:先设置高、低两个阈值(一般高阈值是低阈值的2~3倍),遍历整个灰度矩阵,若某点的梯度高于高阈值,则在结果中置1,若该点的梯度值低于低阈值,则在结果中置0,若该点的梯度值介于高低原创 2021-10-07 20:47:27 · 9776 阅读 · 0 评论 -
Canny边缘检测Step3——梯度幅值的非极大值抑制(NMS)详解
一、背景知识 Canny算子中的非极大值抑制是在对图像进行梯度求取之后,在梯度方向进行的运算。在John Canny提出Canny算子的论文中,非最大值抑制只是在0、90、45、135四个梯度方向上进行,每个像素点梯度方向按照相近程度用这四个方向来代替。 这样做的好处是简单, 但是这种简化的方法无法达到最好的抑制效果。 因为自然图像中的边缘梯度方向不一定只可能沿着这四个方向。实际图像中的像素点是离散的二维矩阵,处于中心位置C处的梯度方向的两侧的点不一定存在,为了方便表示,我们可以称这两个点为亚像素点原创 2021-10-07 20:36:16 · 10252 阅读 · 5 评论 -
Canny边缘检测Step2——Sobel算子计算梯度信息
相关链接:Canny边缘检测Step1——二维高斯滤波Matlab实现Sobel边缘检测 对Step1(详见:Canny边缘检测Step1——二维高斯滤波)中得到的图像进行一次Sobel滤波,即可得到该图的各种梯度相关信息,结果图如下: 水平和竖直方向梯度: 梯度幅值:...原创 2021-10-07 20:27:34 · 3406 阅读 · 1 评论 -
Canny边缘检测Step1——二维高斯滤波
一、背景知识 高斯滤波器是一种线性滤波器,能够有效的抑制噪声,平滑图像。其窗口模板的系数和均值滤波器不同,均值滤波器的模板系数都是1,而高斯滤波器的模板系数,则随着远离模板中心而减小。所以,高斯滤波器相对均值滤波器而言对图像的模糊程度较小。高斯滤波对图像邻域内像素进行平滑时,邻域内不同位置的像素被赋予不同的权值,对图像进行平滑的同时,同时能够更多的保留图像的总体灰度分布特征。 二维高斯函数如下: 其中(x,y)为点坐标,在图像处理中可认为是整数,σ是标准差。要想得到一个高斯滤波器的核,可以对高原创 2021-10-07 20:21:04 · 4926 阅读 · 0 评论 -
Matlab自编函数实现Sobel边缘检测
一、Sobel边缘检测原理我们使用这两个核分别对原始图像进行滤波(卷积运算),即可得到原始图像在水平方向和竖直方向的梯度。设原始图像的灰度值矩阵为A,则有:得到两个方向的梯度后,我们就可以求出每个像素点的梯度幅值和梯度角度:二、Matlab实现代码% Sobel算子计算梯度得到边缘图像function [result_grad,result_x,result_y,result_deg]=Sobel_filter(image)image=double(image);[h,w]=size(i原创 2021-10-07 20:01:05 · 8814 阅读 · 2 评论