自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(104)
  • 资源 (1)
  • 收藏
  • 关注

原创 使用 Python/Rhinoscript 在 Rhinoceros 中进行 3D 建模 平移/复制/伸缩/旋转(二)

小编在这里即将开启一个新系列学习课程,主要内容为,具体包括,讲解视频会陆续更新在B站,希望大家多多支持!关于相关学习、技术的问题都可以通过B站私信、评论区进行交流!公众号: AI知识物语 B站:出门吃三碗饭。

2024-06-13 23:51:09 302

原创 使用 Python/Rhinoscript 在 Rhinoceros 中进行 3D 建模(一)

小编在这里即将开启一个新系列学习课程,主要内容为,具体包括,讲解视频会陆续更新在B站,希望大家多多支持!关于相关学习、技术的问题都可以通过B站私信、评论区进行交流!公众号: AI知识物语 B站:出门吃三碗饭省流:本文主要讲解如何在Rhino中利用Python编程来实现点、线的创建.

2024-06-07 03:24:04 253

原创 论文阅读:Slabforge: Design Software for Slab-Based Ceramics

这篇论文介绍了一个名为Slabforge的开源网络应用程序,它是为基于平板的陶瓷设计而开发的。Slabforge允许用户设计一系列简单的三维形式,然后生成平面图案和匹配的3D打印模具,这些模具支持构建这些形式。这项研究是在作者自己的陶瓷实践背景下开发的,并描述了在入门陶瓷课程中使用Slabforge创建茶具的研究结果。作者利用这些经验对材料、手工艺、数字制造和软件之间的关系进行了批判性反思,并介绍了在项目过程中遇到的三种摩擦主题。

2024-05-20 03:00:09 1038 1

原创 论文阅读:Real-Time 3D Model Acquisition

这篇论文介绍了一种新的实时3D模型获取系统,该系统允许用户在扫描物体时手动旋转物体,并实时看到模型的更新。这种紧密的反馈循环使用户能够实时发现并填补模型中的孔洞,并确定何时完全覆盖了物体。系统基于60 Hz的结构光测距仪、实时版本的迭代最近点(ICP)算法用于对齐,以及基于点的合并和渲染算法。作者展示了他们的原型系统比传统的模型获取流程更快、更易于扫描物体的能力。a.系统布局它由显示结构光图案的 DLP 投影仪和 NTSC 摄像机组成。添加了绿线和蓝线在这个可视化中。c.扫描开始后不久,数据积累得相对稀疏。

2024-05-09 20:29:32 820 2

原创 论文阅读:Magic-Boost: Boost 3D Generation with Mutli-View Conditioned Diffusion

受益于2D扩散模型的快速发展,3D内容创作最近取得了重大进展。一种有前景的解决方案是对预先训练的 2D 扩散模型进行微调,以利用其生成多视图图像的能力,然后通过快速 NeRF 或大型重建模型等方法将其提升为精确的 3D 模型。然而,由于不一致仍然存在并且生成的分辨率有限,此类方法的生成结果仍然缺乏复杂的纹理和复杂的几何形状。为了解决这个问题,我们提出了 Magic-Boost,这是一种多视图条件扩散模型,可通过短暂的SDS 优化(约 15 分钟)显着细化粗略的生成结果。

2024-04-10 15:07:25 720

原创 论文阅读 TripoSR: Fast 3D Object Reconstruction from a Single Image 单张图片快速完成3D重建

TripoSR,这是一种利用 Transformer 架构进行快速前馈 3D 生成的 3D 重建模型,可在 0.5 秒内从单个图像生成 3D 网格。TripoSR 基于 LRM 网络架构,集成了数据处理、模型设计和训练技术方面的重大改进。对公共数据集的评估表明,与其他开源替代品相比,TripoSR 在数量和质量上都表现出卓越的性能。TripoSR 在 MIT 许可下发布,旨在为研究人员、开发人员和具有 3D 生成人工智能最新进展的创意。

2024-03-18 13:33:39 1507

原创 论文解读Language-based Action Concept Spaces Improve Video Self-Supervised Learning

最近的对比语言图像预训练已经导致学习高度可转移和鲁棒的图像表示。然而,在最少的监督下将这些模型适应视频领域仍然是一个悬而未决的问题。我们朝这个方向探索了一个简单的步骤,使用语言绑定的自我监督学习将图像 CLIP 模型适应视频领域。针对时间建模修改的主干在自蒸馏设置下进行训练,训练目标在动作概念空间中运行。使用相关文本提示从语言编码器中提取的各种动作概念的特征向量构建了这个空间。一个了解动作及其属性的大型语言模型会生成相关的文本提示。我们引入了两个训练目标,即概念蒸馏和概念对齐。

2024-01-04 00:50:39 884

原创 Nerf论文阅读笔记:Neus:Learning Neural Implicit Surfaces by Volume Rendering for Multi-view Reconstruction

摘要本文的总目标是实现从2D图片到3D模型的高保真重建(使用神经渲染方法)。2020年Niemeyer等人提出的DVR和2020年Yariv等人提出的IDR是现存的神经表面重建(neural surface reconstruction)方法,但他们都依赖前景遮罩(foreground mask)提供监督且训练不稳定。

2024-01-04 00:13:08 677

原创 Pytorch入门学习——快速搭建神经网络、优化器、梯度计算

本文将回答下面的几个问题:(1)不构建计算图、手动实现梯度计算、手动SGD更新参数(2)数据张量和参数张量不分离、自动计算梯度、手动SGD更新参数(3)数据张量和参数张量不分离、自动计算梯度、手动SGD更新参数(4)数据张量和参数张量不分离、自动计算梯度、使用Adam优化算法自动更新参数(5)自定义操作(需手动实现前向传播、反向传播)(6)自定义Module。

2023-08-01 21:13:59 1497

原创 论文解读Neural Body: Implicit Neural Representations with Structured Latent Codes for Novel View Synthes

本文解决了人类表演者从一组非常稀疏的摄像机视图中合成新颖视图的挑战。最近的一些工作表明,在给定密集输入视图的情况下,学习 3D 场景的隐式神经表示可以实现卓越的视图合成质量。然而,如果视图高度稀疏,表示学习就会不适定。为了解决这个不适定问题,我们的关键思想是整合对视频帧的观察。为此,我们提出了神经体,一种新的人体表示,它假设不同帧上学习的神经表示共享锚定到可变形网格的同一组潜在代码,以便跨帧的观察可以自然地整合。可变形网格还为网络提供几何指导,以更有效地学习 3D 表示。

2023-07-31 21:46:49 599

原创 深度学习入门教程(2):使用预训练模型来文字生成图片TextToImageGenerationWithNetwork

文本到图像模型是一种机器学习模型,它将自然语言描述作为输入并生成与该描述匹配的图像。由于深度神经网络的进步,此类模型于 2010 年代中期开始开发。2022 年,最先进的文本到图像模型的输出,例如 OpenAI 的 DALL-E 2、Google Brain 的 Imagen、Midjourney 和 StabilityAI 的 Stable Diffusion 的输出开始接近真实照片和人类绘制艺术的质量。

2023-07-27 20:59:19 764

原创 如何使用Git上传代码到GitHub简单教程

git add .如图。

2023-07-27 14:50:59 189

原创 深度学习入门教程(1):用神经网络预测糖尿病病例Predict Diabetes Cases with Neural Networks

深度学习入门教程(1):用神经网络预测糖尿病病例Predict Diabetes Cases with Neural Networks数据集链接,你也可以在我的Github项目仓库里找到这是一个来自UCI机器学习库的标准机器学习数据集。它描述了皮马印第安人的五年内病历数据以及他们是否患有糖尿病。Number of times pregnant 怀孕次数Plasma glucose concentration at 2 hours in an oral

2023-07-27 13:54:07 968

原创 NeRF神经辐射场中关于光线从世界坐标系转换为NDC坐标系 Representing Scenes as Neural Radiance Fields for View Synthesis

本文旨在回复一个粉丝的关于坐标系变换编程提问,并结合下面的一个代码进行解释(完整代码参考我前面的文章)补充:[希望那个同学可以看见,因为公众号对话10天未互动默认无法再回复消息了。提问如下:回答:现在将进行数学公式的一个推断。

2023-07-16 02:50:59 1047 1

原创 Siren论文阅读笔记:Implicit Neural Representations with Periodic Activation Functions具有周期激活函数的隐式神经表示

Siren论文阅读笔记:Implicit Neural Representations with 由神经网络参数化的隐式定义的、连续的、可微的信号表示已经成为一种强大的范例,与传统的表示相比,它提供了许多可能的好处。然而,当前用于此类隐式神经表示的网络架构无法对信号进行精细细节建模,并且无法表示信号的空间和时间导数,尽管事实上这些对于许多隐式定义为偏微分方程解的物理信号至关重要。我们建议利用周期性激活函数进行隐式神经表示,并证明这些网络(称为正弦表示网络或 SIREN)非常适合表示复杂的自然信号及其导数。

2023-07-16 00:38:10 1428 2

原创 三维重建以及神经渲染中的学习(三)

三维重建以及神经渲染中的学习三维图形可控生成:本文内容为参加过去一次暑期课程学习时的笔记,浅浅记录下。

2023-07-12 16:53:55 242

原创 自由视点合成中的表征学习(二)

本文内容为参加过去一次暑期课程学习时的笔记,浅浅记录下。自由视点合成中的表征学习(二)

2023-07-12 16:51:54 161

原创 三维重建以及神经渲染中的学习(一)

三维重建以及神经渲染中的学习(一)本文内容为参加过去一次暑期课程学习时的笔记,浅浅记录下。点云points:由一组离散三维点表征物体表面+推理速度快,容易获取-离散表征,无拓扑关系由离散点和面表征物体表面+推理速度快,具备拓扑关系-离散表征,拓扑关系难优化整个场景表征为离散化+推理速度快,可表征拓扑关系-栅格分辨率受限,可视化的时候要转化为显示表征+可表征拓扑关系,不受分辨率限制-推理速度慢,可视化的时候要转为显示表征。

2023-07-12 16:50:09 254

原创 Nerf论文阅读笔记Neuralangelo: High-Fidelity Neural Surface Reconstruction

Nerf论文阅读笔记Neuralangelo: High-Fidelity Neural Surface Reconstruction神经表面重建已被证明是有效的非常适合通过基于图像的神经渲染恢复密集的 3D 表面。然而,当前的方法很难恢复现实世界场景的详细结构。为了解决这个问题,我们提出了 Neuralangelo,它将多分辨率 3D 哈希网格的表示能力与神经表面渲染相结合。我们的方法有两个关键要素:(1) 用于计算高阶导数作为平滑操作的数值梯度;(2) 对控制不同细节级别的哈希网格进行从粗到细的优化。

2023-07-11 19:11:17 1458

原创 贝叶斯分类器浅讲

贝叶斯分类器-----------朴素贝叶斯---------b站回馈粉丝举例,下面是不同水果的不同属性(属性理解为颜色、添堵、数量等等),贝叶斯分类器可以实现,你输入一些属性,不告诉他是什么水果(可以黑色的盒子装起来),分类器会基于下面表的属性,去预测黑色盒子里面的到底是什么水果。比如,x,y 第一象限有很多点(离散点,彼此独立),对模型,通俗来说叫y=kx函数进行建模,k就是我们需要构建的参数,使得这些点尽量分布or靠近去y=kx模型的附近。

2023-07-09 17:59:03 239 1

原创 作为一名研究生/博士生,我应该知道什么

作为一名研究生/博士生,我应该知道什么

2023-07-07 15:46:03 342

原创 Nerf论文阅读笔记:Efficient Neural Radiance Fields for Interactive Free-viewpoint Video用于交互式自由视点视频的高效神经辐射场

本文旨在解决高效制作交互式自由视点视频的挑战。最近的一些工作为神经辐射场配备了图像编码器,使它们能够跨场景泛化。在处理动态场景时,他们可以简单地将每个视频帧视为单独的场景,并执行新颖的视图合成以生成自由视点视频。然而,它们的渲染过程很慢并且不能支持交互式应用程序。一个主要因素是他们在推断辐射场时对空白空间中的大量点进行采样。我们提出了一种新颖的场景表示,称为 ENeRF,用于快速创建交互式自由视点视频。具体来说,给定一帧的多视图图像,我们首先构建级联成本量来预测场景的粗略几何形状。粗糙的几何结构允许我。

2023-07-06 17:26:20 556 1

原创 Nerf-Wild代码学习笔记Neural Radiance Fields for Unconstrained Photo Collections

本文为记录自己在Nerf学习道路的一些笔记,包括对论文以及其代码的思考内容。公众号: AI知识物语 B站讲解:出门吃三碗饭。Nerf-Wild代码学习笔记Neural Radiance Fields for Unconstrained Photo Collections

2023-07-05 19:56:49 556 1

原创 Nerf代码学习笔记NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis

本文为记录自己在Nerf学习道路的一些笔记,包括对论文以及其代码的思考内容。公众号: AI知识物语 B站讲解:出门吃三碗饭本篇文章主要针对其代码来学习其内容,关于代码的理解可能会有出入,欢迎批评指正!!!(论文是论文:https://arxiv.org/abs/2003.08934)NeRF: Representing Scenes as Neural Radiance Fields for View Synthesis代码地址,自取Nerf 与unity结合这里我们准备的llff类型的数据,具体

2023-07-03 21:30:58 1138 2

原创 Nerf-Wild神经辐射场论文学习笔记 Neural Radiance Fields for Unconstrained Photo Collections

NeRF in the Wild: Neural Radiance Fields for Unconstrained Photo Collections论文本文为记录自己在Nerf学习道路的一些笔记,包括对论文以及其代码的思考内容。公众号: AI知识物语 B站讲解:出门吃三碗饭

2023-07-02 02:05:57 454

原创 Nerf论文前后介绍以及今后方向(2020年各个方向工作论文分析) NEURAL VOLUME RENDERING:NERF AND BEYOND

你好!这里是“出门吃三碗饭”本人,视频解说可以关注B站,即可找到对应视频,另外可以关注《AI知识物语》 公众号获取更多详情信息。Nerf是一个非常美丽的算法,因为简单,而美丽。Nerf论文前后介绍以及今后方向(2020年各个方向工作论文分析) NEURAL VOLUME RENDERING:NERF AND BEYOND

2023-06-24 16:55:49 1391

原创 Nerf论文前后介绍以及今后方向(2020)学习NEURAL VOLUME RENDERING:NERF AND BEYOND

Nerf论文前后介绍以及今后方向(2020)学习NEURAL VOLUME RENDERING:NERF AND BEYOND你好!这里是“出门吃三碗饭”本人,视频解说可以关注B站,即可找到对应视频,另外可以关注《AI知识物语》 公众号获取更多详情信息。Nerf是一个非常美丽的算法,因为简单,而美丽。

2023-06-23 23:16:58 946

原创 Nerf如何制作自己的llff数据集

-----------------------------------20230427更新----------------------------------------------你好!这里是“出门吃三碗饭”本人,本文章接下来将介绍自己制作Nerf数据集,让你自己动手渲染第一个三维模型。视频解说可以关注B站,搜索 出门吃三碗饭 ,即可找到对应视频(预计11.24更新),另外可以关注《AI知识物语》 公众号获取更多详情信息。讲解视频链接如下。

2023-06-15 15:30:55 3213 11

原创 Mip-Nerf三维重建代码复现教程——环境配置

你好!这里是“出门吃三碗饭”本人,本文章接下来将介绍如何从0运行2020会议Mip-Nerf的Pytorch版本,让你自己动手渲染第一个三维模型。视频解说可以关注B站,搜索 出门吃三碗饭 ,),另外可以关注《AI知识物语》 公众号获取更多详情信息。挖个坑,争取文章发布一周内更新好其代码讲解。

2023-06-09 13:06:01 3007 8

原创 cuda编程学习——原子函数(十)

CUDA C编程权威指南》以及 CUDA官方文档CUDA编程:基础与实践 樊哲勇文章、讲解视频同步更新公众《AI知识物语》,B站:出门吃三碗饭。

2023-06-01 19:32:03 670

原创 cuda编程学习——CUDA共享内存性能优化(九)

CUDA C编程权威指南》以及 CUDA官方文档CUDA编程:基础与实践 樊哲勇文章、讲解视频同步更新公众《AI知识物语》,B站:出门吃三碗饭。

2023-06-01 19:14:25 1537

原创 cuda编程学习——CUDA全局内存性能优化(八)

CUDA C编程权威指南》以及 CUDA官方文档CUDA编程:基础与实践 樊哲勇文章、讲解视频同步更新公众《AI知识物语》,B站:出门吃三碗饭。

2023-05-31 15:55:44 1101

原创 cuda编程学习——CUDA内存介绍(七)

现代计算机中的内存往往存在一种组织结构(hierarchy)。在这种结构中,含有多种类 型的内存,每种内存分别具有不同的容量和延迟(latency,可以理解为处理器等待内存数据的时间)。一般来说,延迟低(速度高)的内存容量小,延迟高(速度低)的内存容量大。

2023-05-31 14:35:35 1302

原创 cuda编程学习——卷积计算CUDA、Pytorch比较 干货向(六)

(1)数据传输比例较小。(2) 核函数的算术强度较高。(3)核函数中定义的线程数目较多。

2023-05-30 18:38:56 1276 1

原创 cuda编程学习——GPU加速/时间计时Clock 干货向(五)

(1)数据传输比例较小。(2) 核函数的算术强度较高。(3)核函数中定义的线程数目较多。

2023-05-27 16:52:54 1498

原创 cuda编程学习——运行错误检测(四)

编写一个头文件(error.cuh),它包含一个检测CUDA运行 时错误的宏函数(macro function),内容如下:(1) #pragma once 是一个预处理指令,其作用是确保当前文件在一个 编译单元中不被重复包含。(2)该宏函数的名称是 CHECK,参数 call 是一个CUDA运行时 API 函数。(3)定义宏时,如果一行写不下,需要在行末写 \,表示续行。

2023-05-27 15:48:53 1706 1

原创 VisualStudio如何运行多个main函数

(1)先建立项目,然后创建2个含有main函数的文件,可以是cpp,也可以cu。被移除文件 左下角 有标志,顺利运行。

2023-05-26 13:09:50 1890 1

原创 PCL学习之点云重建

离散点云• 数据量大• 渲染显示大• 模型操作计算不方便网格模型• 数据量小• 渲染方便• 模型操作计算方便。

2023-05-25 00:43:49 1893

原创 cuda编程学习——基础知识介绍!干货向(三)

CUDA C编程权威指南》以及 CUDA官方文档文章、讲解视频同步更新公众《AI知识物语》,B站:出门吃三碗饭。

2023-05-24 10:56:04 1336

原创 cuda编程学习——第二个cuda程序(官方案例分析)!干货向(二)

最近在做三维重建,尤其是Nerf方面多视角合成工作的时候,意识到了cuda的编程计算可以大大提高其中渲染的计算,最明显的例子是Instant-ngp,Plenoxels等文章,因此后面会学Cuda一段时间,同时也就开了这个新坑。因为笔者也是cuda新手,所以大家有问题的话可以评论区指出,一起学习进步!

2023-05-18 19:08:43 1575 1

recyclerview.zip

recyclerview.zip

2021-08-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除