DreamFusion精读

第一次写博客,主要是想找地方打卡记录一下自己立的一个flag:每周至少精读一篇论文。这也是以前读硕士的时候导师对我最起码的要求。毕业以后我开始松懈了,希望通过在这里记录,对自己起到一个警醒的作用。同时,将读论文时的想法记录成文字,也可以方便自己日后进行回顾查看。我目前的计划是,每一篇论文,大致按自己的感受描述一下论文,再按照论文十问的格式对这篇论文进行解剖。如果还有一些其他方面的理解,那么也会一并附上。

话不多说,第一篇论文,读的是我导师分享的ICLR2023杰出论文奖之一的《DREAMFUSION: TEXT-TO-3D USING 2D DIFFUSION》,这篇论文主要的研究内容就是设计一个二维扩散模型DreamFusion,当输入一段话时,可以使用其自动生成一个三维图像。

简单来说,DreamFusion这篇文章首先大致描述了扩散模型的原理,并且讲述了怎样使用扩散模型作为损失函数去帮助采样。基于此,论文提出了一种SDS方法,描述了使用SDS方法怎样对参数进行采样,而不是对像素采样。在随后讲解了NeRF的基本原理后,论文对整个算法进行了描述。算法一共分为四步:一、随机选取一个相机角度和光线;二、基于此使用NeRF渲染一张图片;三、计算SDS损失相对于NeRF参数的梯度;四、使用优化器更新NeRF的梯度。整个DreamFusion方法对这四步进行反复迭代,直到最后收敛。

实验方面,作者首先将DreamFusion与两种方法进行定性分析,从文章给出的图来看,DreamFusion的效果是几种方法最好的。定量分析方面,作者表明文本到三维图像生成方法方面没有特别好的判定方法,因此沿用了一种此前方法使用过的一种叫做R-Precision的评判标准去和其他方法比较,从数据来看,DreamFusion有一半的指标在三种方法中是最好的。最后作者还从三个方面对DreamFusion的五个模块进行了适应性分析,并分别作了定性和定量分析,得到的结果是五个模块都起到了好的作用。

对于这篇文章,我回答的比较简短,并且暂时没有进行论文十问回答。我的想法是这样的,虽然现在我已经完成了对这篇文章的精读,但是文章中的很多东西我还没有看懂,如扩散模型、NeRF等,需要翻阅引用的相关论文进行溯源,才能真正读懂。而如果在一知半解的情况下盲目进行论文十问回答,得到的答案感觉也不会有什么参考价值。因此,我计划等读完扩散模型、NeRF以及其他相关论文后,重新对这篇论文进行一次精读,等到那时再进行论文十问回答。

不得不感慨,想做成一件事是艰难的。开始精读以后发现,这篇文章对我难度不小。论文用的两方面技术,扩散模型和NeRF,原理我基本不懂,需要从头开始学习,此外,Imagen等特定对比学习技术也需要花时间去研究。读的过程也发生了很多事情,赶路时把笔记本屏幕给摔坏了,只能辗转各个网吧继续阅读,在工作中又有各种各种消磨人意志的事情不断发生。但我相信,前途是光明的,只要不断学习,就会越来越有上路。在精读论文的过程中,我也有了一个其他的发现:思维的锻炼和身体锻炼有相似之处,刚开始时都很痛苦、很煎熬,很让人感到折磨,但只要熬过了开头,并且能够持之以恒,一定能达到自己想要的效果。因此,不要害怕道路的艰险,因为这一路是值得的。加油!

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
提供的源码资源涵盖了安卓应用、小程序、Python应用和Java应用等多个领域,每个领域都包含了丰富的实例和项目。这些源码都是基于各自平台的最新技术和标准编写,确保了在对应环境下能够无缝运行。同时,源码中配备了详细的注释和文档,帮助用户快速理解代码结构和实现逻辑。 适用人群: 这些源码资源特别适合大学生群体。无论你是计算机相关专业的学生,还是对其他领域编程感兴趣的学生,这些资源都能为你提供宝贵的学习和实践机会。通过学习和运行这些源码,你可以掌握各平台开发的基础知识,提升编程能力和项目实战经验。 使用场景及目标: 在学习阶段,你可以利用这些源码资源进行课程实践、课外项目或毕业设计。通过分析和运行源码,你将深入了解各平台开发的技术细节和最佳实践,逐步培养起自己的项目开发和问题解决能力。此外,在求职或创业过程中,具备跨平台开发能力的大学生将更具竞争力。 其他说明: 为了确保源码资源的可运行性和易用性,特别注意了以下几点:首先,每份源码都提供了详细的运行环境和依赖说明,确保用户能够轻松搭建起开发环境;其次,源码中的注释和文档都非常完善,方便用户快速上手和理解代码;最后,我会定期更新这些源码资源,以适应各平台技术的最新发展和市场需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值