自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(429)
  • 资源 (4)
  • 收藏
  • 关注

原创 colmap利用已知的相机内外参数重建场景

colmap 一系列琐碎知识积累

2022-07-01 21:44:39 1391

原创 昨天今天明天专题-计算机视觉与图形学007-COLMAP

COLMAP 是具有图形和命令行界面的通用运动结构 (SfM) 和多视图立体 (MVS) 管道。 它为有序和无序图像集的重建提供了广泛功能。COLMAP适用于多个平台Linux、Windows、Max,并提供了对应的安装方法:http://colmap.github.io/install.html。基于图像的 3D 重建传统上首先使用 Structure-from-Motion 恢复场景的稀疏表示和输入图像的相机位姿。 然后,此输出用作 Multi-View Stereo 的输入,以恢复场景的密集表示.

2022-05-06 09:36:45 1780

原创 Ubuntu下如何重新编译pycuda

(1)首先需要注意的是,尽量不要在github上下载pycuda,因为文件存在损坏,需要在pypi上下载对应的pycuda。(2)重新编译流程按照文件中流程操作就行,但是在操作之前进入到root模式:sudo -E su -p(3)与OpenGL进行交互参考下面的链接,记住作者代码对于当前环境来说存在问题,需要修改tensor中.t()的格式http://www.land-of-kain.de/docs/python_opengl_cuda_opencl/https://documen.tician

2022-03-07 16:45:09 458

转载 针孔相机:单应性矩阵

https://silverwind1982.pixnet.net/blog/post/153225557

2021-12-02 22:27:17 156

原创 预测视频Transformer:提高人工智能预测视频下一个内容的能力

背景对于从自动驾驶汽车到增强现实的应用,人工智能系统能够预测人们未来的行为非常重要。当有人在建造宜家梳妆台时,他们可能会发现自己想知道下一步是安装支腿还是抽屉。根据到目前为止所遵循的步骤,朋友可以帮助建议要添加的正确部分。但这种类型的预测对于 AI 来说是一项具有挑战性的任务,它既需要预测未来活动的多模态分布,又需要对过去行动的进展进行建模。为了应对这一重要挑战,我们利用 Transformer 架构的最新发展,尤其是在自然语言处理和图像建模方面,构建了预测视频转换器 (AVT),这是一种基于端到端注意

2021-11-30 09:13:35 2411

原创 pytorch-(torch.take())根据索引返回指定索引上的数据集合

torch.take(input, index)->Tensor返回一个新的张量,其中的元素是输入元素在给定的索引处,将输入张量视为视为一维张量。结果tensor的形状与索引相同。参数介绍:input:输入tensor。indices:索引接下来看用法:src = torch.tensor([[4, 3, 5], [6, 7, 8]])torch.take(src, torch.tensor([0, 2, 5]))tensor([ 4, 5,

2021-11-29 22:19:05 3933

原创 从单张图重建三维人体模型综述(五)

《Video Based Reconstruction of 3D People Models》本文描述了一种从单个单目视频中获取任意人的精确三维身体模型和纹理的方法,包括正在运动的人。基于一个参数化人体模型方法,我们提出了一个鲁棒的处理流程,以4.5mm的重建精度得到三维模型形状,包括穿着衣服的人。我们方法的核心是将动态身体姿势转换为标准参考系。我们的主要贡献是一种方法来变换与动态人体轮廓相对应的轮廓锥,以在公共参考框架中获得视觉外壳。这使得能够基于大量帧有效地估计一致的3D形状、纹理和植入的动画骨架。

2021-11-04 09:38:11 1067 1

原创 Visio绘图汇总

VISIO画立体图——VISIO画图技巧(该教程总结了Visio绘制立体图,并将其保存收藏为一个单独模块)

2021-11-03 11:24:56 2632

原创 从单张图重建三维人体模型综述(四)

《Temporal Consistency Loss for High Resolution Textured and Clothed 3D Human Reconstruction from Monocular Video》我们提出了一种从单目视频来学习时间一致的三维重建人衣服的新方法。使用体积、隐式或参数化人体形状模型从单目视频进行三维人体重建的最新方法产生每帧重建,在应用于视频时,会产生时间不一致的输出和有限的性能。在本文中,我们介绍了一种从单目视频中学习时间一致性特征的方法,该方法通过提出两个改进

2021-11-03 09:10:03 900

原创 从单张图重建三维人体模型综述(三)

《Multi-View Consistency Loss for Improved Single-Image 3D Reconstruction of Clothed People》我们提出了一种新的方法,以提高从一个单一图像三维重建服装人体形状的精度。最近的工作引入了体积、隐式和基于模型的形状学习框架,用于从一个或多个图像重建对象和人。然而,由于服装、头发、身体大小、姿势和相机视点导致形状的巨大变化,服装人体重建的准确性和完整性受到限制。本文介绍了克服这一局限性的两项进展:一是新的真实服装人合成数据集3

2021-11-02 08:47:15 1015 2

原创 从单张图重建三维人体模型综述(二)

《3D Human Body Reconstruction from a Single Image via Volumetric Regression》本文提出使用端到端卷积神经网络通过体积回归直接重建人体的三维几何结构。所提出的方法不需要拟合形状模型,并且可以从各种输入类型(无论是标记点、图像还是分割模板)进行训练。此外,不可见的部分,无论是自遮挡的还是其他的,仍然被重建,这与深度图回归不同。我们提出的结果表明,我们的方法可以处理姿态变化和详细的重建给定适当的数据集的训练。《Combining Imp

2021-11-01 08:57:30 759

原创 从单张图重建三维人体模型综述(一)

《DeepHuman: 3D Human Reconstruction from a Single Image》我们提出了DeepHuman,一种用于从单个RGB图像重建三维人体的图像引导体积到体积的CNN。为了减少与曲面几何重建相关的歧义,甚至对于不可见区域的重建,我们提出并利用SMPL模型生成的密集语义表示作为额外输入。我们网络的一个关键特征是,它通过体积特征变换将不同比例的图像特征融合到三维空间中,这有助于恢复精确的曲面几何。可见表面细节通过法线细化网络进一步细化,该网络可以使用我们提出的体积法线投

2021-10-31 13:15:01 1743

原创 Deep Convolutional Network for Image Super-Resolution

摘要我们提出了一种单图像超分辨率(SR)的深度学习方法。我们的方法直接学习低/高分辨率图像之间的端到端映射。映射表示为深卷积神经网络(CNN),该网络将低分辨率图像作为输入,并输出高分辨率图像。我们进一步表明,传统的基于稀疏编码的SR方法也可以看作是一个深卷积网络。但与分别处理每个组件的传统方法不同,我们的方法联合优化了所有层。我们的deep CNN具有轻量级结构,同时展示了最先进的恢复质量,并实...

2021-10-21 09:22:34 115

原创 Learning a Deep Convolutional Network for Image Super-Resolution 超分辨开山之作

摘要我们提出了一种单图像超分辨率(SR)的深度学习方法。我们的方法直接学习低/高分辨率图像之间的端到端映射。映射表示为深卷积神经网络(CNN),该网络将低分辨率图像作为输入,并输出高分辨率图像。我们进一步表明,传统的基于稀疏编码的SR方法也可以看作是一个深卷积网络。但与分别处理每个组件的传统方法不同,我们的方法联合优化了所有层。我们的deep CNN具有轻量级结构,同时展示了最先进的恢复质量,并实现了快速实用的在线使用。总的来说,这项工作的贡献主要体现在三个方面:1.我们提出了一种用于图像超分辨率的

2021-10-20 15:28:16 581

原创 OpenCV-Python几个好玩有趣的项目

1.使用Open CV在图像上创建水印项目工程代码2.实时人脸检测模型项目工程代码3.用OpenCV制作的人脸交换应用程序项目工程代码4.智能考勤系统项目工程代码5.拼贴马赛克生成器项目工程代码6.智能消毒卫生隧道项目工程代码7.边缘无触摸显示界面项目工程代码8.数独游戏项目工程代码9使用OpenCV的虚拟绘画应用程序项目工程代码10OpenCV社交距离系统项目工程代码11车辆计数和分类系统项目工程代码12OpenCV图像反向搜索引擎项目工程代码13

2021-10-17 00:07:10 4114

转载 Pytorch学习之LSTM识别MNIST数据集

引入库函数引入pytorch库,主要是nn,optim,Variable。import torchfrom torch import nn,optimfrom torch.autograd import Variablefrom torch.utils.data import DataLoaderfrom torchvision import datasets,transforms设置超参数设置超参数,其为神经网络的基础配置。# 超参数batch_size = 100 # 批大小

2021-10-16 23:37:20 836

原创 TorchVision官方文档翻译为中文-示例库变换图解-003

此示例演示了torchvision.transforms模块中提供的各种变换。from PIL import Imagefrom pathlib import Pathimport matplotlib.pyplot as pltimport numpy as npimport torchimport torchvision.transforms as Tplt.rcParams["savefig.bbox"] = 'tight'orig_img = Image.open(Path('

2021-10-05 16:01:09 899

转载 CSDN文章如何迁移至微信公众号

工具链接给出markdown在线转换工具链接。http://md.aclickall.com/https://www.mdnice.com/https://md.openwrite.cn/2. 使用方法使用方法也非常简单。将markdown格式的文章粘贴到左侧,右侧便可实时预览效果。觉得效果可以了,点击页面上部的复制按钮就可将带有格式内容复制出来,粘贴到微信公众号的图文编辑中。...

2021-10-05 11:43:15 567

原创 TorchVision官方文档翻译为中文-示例库Tensor转换与JIT-002

此示例演示了张量图像上的图像变换现在支持的各种功能。特别是,我们展示了如何在GPU上执行图像转换,以及如何使用JIT编译编写它们的脚本。在v0.8.0之前,torchvision中的转换传统上是以PIL为中心的,因此存在多个限制。现在,从v0.8.0开始,转换实现与Tensor和PIL兼容,我们可以实现以下新功能:变换多波段torch张量图像(具有3-4个以上通道)torchscript与用于部署的模型一起进行转换支持GPU加速批处理转换,如视频直接以torchscript支持的torch张量

2021-10-05 10:57:14 1176

原创 TorchVision官方文档翻译为中文-目录及相关图像视频解码包定义函数-001

torchvision软件包包括流行的数据集、模型架构和用于计算机视觉的通用图像转换。包参考torchvision.datasetsCaltechCelebACIFARCityscapesCOCOEMNISTFakeDataFashion-MNISTFlickrHMDB51ImageNetKinetics-400KITTIKMNISTLSUNMNISTOmniglotPhotoTourPlaces365QMNISTSBDSBUSEMEIONSTL10SV

2021-10-05 10:24:47 460

原创 18个面向初学者的经典开源计算机视觉项目-图像分类篇Inception(三)

在研究这篇文章时,有一点很清楚。2014年是发展真正流行的图像分类预训练模型的标志性一年。尽管上述VGG-16在当年的ILSVRC中排名第二,但排名第一的不是别人,正是谷歌——通过它的GoogLeNet或Inception。最初的论文提出了Inceptionv1模型。在只有700万个参数的情况下,即比当时流行的模型(如VGG和AlexNet)小得多,再加上较低的错误率,你就可以看出为什么它是一个突...

2021-10-04 13:49:53 129

原创 18个面向初学者的经典开源计算机视觉项目-图像分类篇Inception(三)

在研究这篇文章时,有一点很清楚。2014年是发展真正流行的图像分类预训练模型的标志性一年。尽管上述VGG-16在当年的ILSVRC中排名第二,但排名第一的不是别人,正是谷歌——通过它的GoogLeNet或Inception。最初的论文提出了Inceptionv1模型。在只有700万个参数的情况下,即比当时流行的模型(如VGG和AlexNet)小得多,再加上较低的错误率,你就可以看出为什么它是一个突破性的模型。不仅如此,本文的主要创新也是另一个突破—Inception模块。简单来说,Inception

2021-10-01 00:05:06 261

转载 pytorch 复制、粘贴、替换Model某一层的训练参数

使用pytorch保存模型参数与加载模型参数的方法可以对某一层的参数进行替换、复制:打印当前网络的参数:nn.Model.state_dict()加载网络参数:nn.Model.load_state_dict()代码示例mport torch.nn as nnclass Net1(nn.Module): def __init__(self, input_dim, output_dim): super().__init__() self.linear1 =

2021-09-30 10:15:57 1133

原创 18个面向初学者的经典开源计算机视觉项目-图像分类篇VGG(二)

人脑可以很容易地识别和区分图像中的物体。例如,给定猫和狗的图像,在纳秒之内,我们就能区分它们,我们的大脑也能感知到这种差异。如果一台机器模仿这种行为,它就和我们能得到的人工智能一样接近。随后,计算机视觉领域的目标是模仿人类视觉系统——在这方面,已经有许多里程碑突破了障碍。此外,如今的机器可以轻松区分不同的图像,检测物体和人脸,甚至生成不存在的人的图像!很迷人,不是吗?当我开始使用计算机视觉时,我的第一次经历是图像分类。机器区分物体的能力带来了更多的研究途径——比如区分人。迁移学习的出现进一步加速

2021-09-27 23:21:02 826

原创 18个面向初学者的经典开源计算机视觉项目-图像分类篇(一)

18个经典开源计算机视觉项目分为以下几类:图像分类人脸识别用GANs进行神经风格转换场景文本检测基于DETR的目标检测语义分割自动驾驶车辆的车道检测图像字幕人体姿势估计项目基于面部表情的情绪识别今天主要给大家介绍一下,图像分类:用于图像分类的开源计算机视觉项目图像分类是计算机视觉中的一项基本任务。在这里,目标是通过为图像指定特定标签来对图像进行分类。我们人类很容易理解和分类我们看到的图像。但对于一台机器来说情况就大不相同了。对机器来说,区分汽车和大象是一项繁重

2021-09-27 08:34:25 1806

原创 学习+科研+做项目 深度学习最全详细资料

李宏毅2020机器学习深度学习(完整版)国语[双语字幕]吴恩达深度学习deeplearning.ai深度学习(卷积网络、循环神经网络、对抗神经网络、Tensorflow实战)更多资料请关注公众号:计算机视觉与图形学实战李宏毅2020机器学习深度学习(完整版)国语目录157.5万播放P1 机器学习 37:08P2 Rule of ML 2020 22:04P3 Regression - Case Study 1:18:35P4 Basic Concept 43:14

2021-09-24 23:27:23 740

原创 学习+科研+做项目 Python视频详细讲解

Python教程全套,现在分享给大家,入门到精通(Python全栈开发教程)黑马程序员Python教程_600集Python从入门到精通教程[小甲鱼]零基础入门学习Python更多资料请关注公众号:计算机视觉与图形学实战Python教程全套,现在分享给大家,入门到精通(Python全栈开发教程)目录播放量877.4万P1 0.前言相关介绍 04:27P2 1.Python的自述 11:35P3 2.Python简介 04:04P4 3.Python开发环境的安装 0

2021-09-23 23:48:04 540

原创 视觉与图形学领域的封神论文-基于强化学习的神经架构搜索

通过一个controller在搜索空间(search space)中得到一个网络结构(child network),然后用这个网络结构在数据集上训练得到准确率,再将这个准确率回传给controller,controller继续优化得到另一个网络结构,如此反复进行直到得到最佳的结果。这里使用RNN网络目的是在一个variable-length space中搜索模型,而原先其他超参数优化只能在一个fixed-length space中搜索模型。摘要:神经网络是一种功能强大且灵活的模型,适用于图像、语..

2021-09-23 20:05:32 360

原创 视觉与图形学领域的封神论文-MobileNets有效的卷积网络用于移动视觉

MobileNet模型可应用于各种识别任务,以实现高效的设备智能。摘要:我们为移动和嵌入式视觉应用提供了一类称为MobileNet的高效模型。MobileNets基于一种流线型架构,使用深度可分离卷积构建轻量级深层神经网络。我们引入了两个简单的全局超参数,可以有效地在延迟和准确性之间进行权衡。这些超参数允许模型生成器根据问题的约束为其应用程序选择适当大小的模型。我们在资源和精度权衡方面进行了大量实...

2021-09-23 07:00:00 79

原创 学习+做项目+科研 MXNet最全详细视频资料

更多资料请关注公众号:计算机视觉与图形学实战[MXNet/Gluon] 动手学深度学习第一课:从上手到多类分类目录播放量 9.4万- [30min] 介绍- [15min] 演示从干净系统安装依赖包- [15min] 使用NDArray来处理数据- linear algebra- probablity- [15min] 使用autograd来自动求导- [20min] 第一个模型:线性回归- [10min] 上面模型使用Gluon的实现- [15mi.

2021-09-22 23:02:14 140

原创 学习+做项目+科研 Keras详细讲解-视频

【莫烦Python】Keras 快速搭建神经网络Keras深度学习快速简明教程 最易学的深度学习入门课程 人人都可以学的人工智能入门keras入门Keras项目实战课程更多资料请关注公众号:计算机视觉与图形学实战【莫烦Python】Keras 快速搭建神经网络目录(播放量 18.1万)目录(播放量 18.1万)P1 科普: 人工神经网络 VS 生物神经网络 04:40P2 什么是神经网络 (机器学习) 07:15P3 神经网络 : 梯度下降 04:08P4 科普:

2021-09-22 22:52:35 165

原创 学习+科研+做项目 Tensorflow最全详细讲解

【莫烦Python】Tensorflow 搭建自己的神经网络tensorflow2.0入门与实战 2019年最通俗易懂的课程【北京大学】Tensorflow2.0更多资料请关注公众号:计算机视觉与图形学实战【莫烦Python】Tensorflow 搭建自己的神经网络目录(播放量120.5万次)P1 科普: 人工神经网络 VS 生物神经网络 04:40P3 神经网络 : 梯度下降 (Gradient Descent in Neural Nets) 04:08P5 1

2021-09-22 00:01:35 350

原创 学习+科研+做项目 PyTorch最详细视频讲解

PyTorch深度学习快速入门教程(绝对通俗易懂!)【小土堆】《PyTorch深度学习实践》完结合集莫烦Python-PyTorch 神经网络Pytorch 入门到精通全教程 卷积神经网络 循环神经网络更多相关资料请关注公众号:计算机视觉与图形学实战PyTorch深度学习快速入门教程(绝对通俗易懂!)【小土堆】目录(播放量41.6万)P1.PyTorch环境的配置及安装(Configuration and Installation of PyTorch)【PyTorch教程】

2021-09-21 23:45:11 776

原创 面试+学习+做项目 OpenVINO最全视频讲解

基于 Python 的 OpenVINO 开发实战教程树莓派 4B+OpenVINO 快速实现人脸识别OpenVINO™_使用指南更多资料请关注:计算机视觉与图形学实战基于 Python 的 OpenVINO 开发实战教程目录(B站播放量第一)P1 01-02 OpenVINO™ Toolkit 框架介绍、安装与演示 29:58P3 04 基本的图像读写操作 09:43P5 06 简单的图像操作 16:07P7 08 OpenVINO SDK介绍与开发流程 0

2021-09-21 23:18:54 328

原创 面试+学习+做项目+最全Java视频讲解

Java零基础教程视频(适合Java 0基础,Java初学入门)目录 (1186万播放量)P1 001–Java零基础-安装EditPlus 14:10P2 002–Java零基础-计算机概述 08:57P3 003–Java零基础-Java软件工程师概述 09:12P4 004–Java零基础-常用DOS命令 19:21P5 005–Java零基础-显示文件扩展名 10:23P6 006–Java零基础-计算机语言发展史 16:56P7 007–Ja

2021-09-21 22:52:51 1950

原创 OpenCV-Python-C++ 全套视频详讲

2021OpenCV-C++课程实践(理论与实践)目录计算机视觉课程第一讲-VS2015环境配置+开发库OpenCV安装+读取计算机视觉课程第一讲-VS2015环境配置+开发库OpenCV安装+读取显示图像程序计算机视觉课程第二讲-OpenCV4读取、显示、保存-视频&摄像头数据计算机视觉课程第二讲-OpenCV4读取、显示、保存-视频&摄像头数据计算机视觉课程第三讲-OpenCV4钢管检测项目上集:形态学处理(膨胀、腐蚀、开运算、闭运算、顶帽、黑帽、

2021-09-21 22:07:00 310

原创 视觉与图形学封神的论文-YOLOv4优化目标检测的精度和速度

比较YOLOv4和其他最先进的目标检测。YOLOv4的运行速度是EfficientSet的两倍,性能相当。YOLOv3的AP和FPS分别提高10%和12%摘要:据说有大量的特征可以提高卷积神经网络(CNN)的准确性。需要在大型数据集上对这些特征的组合进行实际测试,并对结果进行理论证明。某些功能只在某些模型上运行,或只针对某些问题运行,或只针对小规模数据集运行;而一些特性,如批处理规范化和残差连接,则适用于大多数模型、任务和数据集。我们假设这些通用特征包括加权残差连接(WRC)、跨阶段部分连接(CSP..

2021-09-20 16:55:21 752

原创 各个视觉与图形学领域的封神论文-MobileNets有效的卷积网络用于移动视觉

MobileNet模型可应用于各种识别任务,以实现高效的设备智能。摘要:我们为移动和嵌入式视觉应用提供了一类称为MobileNet的高效模型。MobileNets基于一种流线型架构,使用深度可分离卷积构建轻量级深层神经网络。我们引入了两个简单的全局超参数,可以有效地在延迟和准确性之间进行权衡。这些超参数允许模型生成器根据问题的约束为其应用程序选择适当大小的模型。我们在资源和精度权衡方面进行了大量实验,与其他流行的ImageNet分类模型相比,我们表现出了强大的性能。然后,我们展示了MobileNet..

2021-09-20 15:34:19 127

原创 github疯狂涨星-使用精心制作的天然化妆品躲开攻击

在上面图像中,攻击者被人脸识别(FR)系统识别。在中间图像中,我们的方法使用代理模型来计算数字域中的对抗性组成,然后应用于物理域。因此,FR系统无法识别攻击者(下图)摘要:最先进的监控系统使用深度学习人脸识别模型来识别,例如:公共区域(如机场)的个人。先前的研究表明,在数字和物理领域,使用对抗性机器学习(AML)攻击成功地规避此类系统的识别。然而,物理域中的攻击需要对人类参与者的面部进行重大操纵,这可能会引起人类观察员(例如机场安检人员)的怀疑。在这项研究中,我们提出了一种新的黑盒AML攻击方法,该..

2021-09-20 14:47:22 143

原创 github疯狂涨星-FEELVOS用于视频目标分割的快速端到端嵌入学习

表1:该表显示了我们的哪些设计目标(在本文中有更详细的描述)是通过最近的方法实现的。我们的方法是唯一能够实现所有设计目标的方法。摘要:许多最近成功的视频对象分割(VOS)方法过于复杂,严重依赖于对第一帧的微调,或速度较慢,因此实际应用有限。在这项工作中,我们提出FEELVOS方法。FEELVOS是一种简单快速的方法,不依赖于微调。为了分割视频,对于每一帧,FEELVOS使用语义像素嵌入全局和局部匹配机制将信息从视频的第一帧和前一帧传输到当前帧。与以前的工作相比,我们的嵌入仅用作卷积网络的内部指导。我..

2021-09-20 13:15:12 465

136W 打印机资料.zip

136W 打印机资料

2021-08-08

数据集+实验指导书.rar

配合本人博客中的相关代码中要用到的相关数据集,或者请下吴恩达老师课程作业中公布的数据

2019-10-23

typora-setup-x64

一款非常不错的Markdown 编辑器,特意与大家分享!!!

2018-03-11

Tiny-yolo预训练模型darknet.conv.weights

Tiny-yolo 预训练模型darknet.conv.weights做初始化,进行后期精调

2017-10-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除