【读论文】【速读】4D Gaussian Splatting for Real-Time Dynamic Scene Rendering

1. What

4D Gaussian Splatting (4D-GS) as a holistic representation for dynamic scenes rather than applying 3D-GS for each individual frame.

It uses an encoder and decoder structure to predict the motion of each Gaussian over time. The core idea is to represent the 4D information (x,y,z,t) into 2D HexPlane and then use MLP and decoder to extract the information of the change of Gaussian. This approach allows for efficient processing and storage of high-dimensional data while preserving the necessary spatiotemporal information.

2. Preliminary

There are two dynamic methods in NeRF and one method in Gaussian, as shown below:

在这里插入图片描述

As for NeRF, all the dynamic NeRF algorithms can be formulated as:

c , σ = M ( x , t ) c,\sigma=\mathcal{M}(\mathbf{x},t) c,σ=M(x,t)

  1. In Fig. 2 (a), the canonical mapping volume rendering transforms each sampled point into a canonical space: ϕ t : ( x , t ) → Δ x \phi_{t}:(\mathbf{x},t)\to\Delta\mathbf{x} ϕt:(x,t)Δx and calculates the color and density along each ray:

    c , σ = N e R F ( x + Δ x ) . c,\sigma=\mathrm{NeRF}(\mathbf{x}+\Delta\mathbf{x}). c,σ=NeRF(x+Δx).

  2. In Fig. 2 (b), the time-aware volume rendering. It won’t change the rendering path, oppositely, it directly calculates the features of each point at a time:

    c , σ = N e R F ( x , t ) . c,\sigma=\mathrm{NeRF}(\mathbf{x},t). c,σ=NeRF(x,t).

3. What

在这里插入图片描述

The network to learn the Gaussian deformation field includes an efficient spatial-temporal structure encoder H \mathcal{H} H and a Gaussian deformation decoder D \mathcal{D} D for predicting the deformation of each 3D Gaussian.

3.1 Spatial-Temporal Structure Encoder

The input is a 4D data containing x , y , z , t x,y,z,t x,y,z,t. It will be represented by six 2D planes about { ( x , y ) , ( x , z ) , ( y , z ) , ( x , t ) , ( y , t ) , ( z , t ) } \{(x,y),(x,z),(y,z),(x,t),(y,t),(z,t)\} {(x,y),(x,z),(y,z),(x,t),(y,t),(z,t)}. Each 2D plane will have a resolution, that is the canonical space with a fixed size, and each point such as ( x , t ) (x,t) (x,t) will contain information about the characteristics of the change in x-coordinate at different time points. Similarly, the x y xy xy plane captures features at different spatial locations (x and y coordinates).

Meanwhile, the 2D planes have an upsample level just like the mipmapping. In the calculation of the feature, it will use interpolation between the two adjacent layers: f h = ⋃ l ∏ i n t e r p ( R l ( i , j ) ) . f_{h}=\bigcup_{l}\prod\mathrm{interp}(R_{l}(i,j)). fh=linterp(Rl(i,j)).

Then, the plane information will become a vector with six values and pass an MLP to the decoder.

3.2 Multi-head Gaussian Deformation Decoder

When all the features of 3D Gaussians are encoded, we can compute any desired variable with a multi-head Gaussian deformation decoder D = { ϕ x , ϕ r , ϕ s } \mathcal{D}=\{\phi_{x},\phi_{r},\phi_{s}\} D={ϕx,ϕr,ϕs}

Δ X = ϕ x ( f d ) , Δ r = ϕ r ( f d ) , Δ s = ϕ s ( f d ) . \Delta\mathcal{X}=\phi_{x}(f_{d}),\Delta r=\phi_{r}(f_{d}),\Delta s=\phi_{s}(f_{d}). ΔX=ϕx(fd),Δr=ϕr(fd),Δs=ϕs(fd).

So finally, we can obtain the deformer 3D Gaussians:

( X ′ , r ′ , s ′ , σ , C ) = ( X + Δ X , r + Δ r , s + Δ s , σ , C ) . (\mathcal X',r',s',\sigma, \mathcal C)=(\mathcal X+\Delta\mathcal X,r+\Delta r,s+\Delta s,\sigma, \mathcal C). (X,r,s,σ,C)=(X+ΔX,r+Δr,s+Δs,σ,C).

  • 7
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: "Mit-Cheetah-Note"是一种学习辅助工具,旨在提高学生的学习效率和效果。它结合了MIT(麻省理工学院)的学习方法和猎豹速读技术。 首先,MIT-Cheetah-Note采用了麻省理工学院的学习方法。这些方法包括主题导图,问题解决和概念联系等。主题导图是一种可视化的学习工具,帮助学生整理和理解知识点之间的关系。问题解决则鼓励学生通过提出问题来主动思考和深入理解知识。概念联系是通过将新知识与已有知识相结合,加深学生对知识的理解。 其次,这个学习工具还集成了猎豹速读技术。速读是一种训练阅效率和记忆力的技巧。通过使用猎豹速读技术,学生可以提高阅速度和理解能力。这对于大量阅任务的学生来说尤其有用,如备考、论文写作等。 MIT-Cheetah-Note采用了数码笔和智能设备相结合的方式进行学习记录和储存。学生可以使用数码笔在纸上做笔记,并通过智能设备将这些笔记同步到云端。这样一来,学生可以随时随地访问他们的学习记录,从而更好地回顾和复习。 总而言之,MIT-Cheetah-Note是将麻省理工学院的学习方法和猎豹速读技术融入一体的学习辅助工具。它帮助学生提高学习效率和效果,并通过数字化技术方便学生的学习记录和辅助复习。 ### 回答2: Mit-Cheetah-Note 是一种人工智能语音助手,最初由麻省理工学院(MIT)研发。该技术基于深度学习和自然语言处理,在提供智能语音交互的同时,还具备类似于记事本的功能。 Mit-Cheetah-Note 可以用于多个方面,例如记录会议笔记、制定待办事项、管理日程安排等。用户可以通过语音指令来创建笔记,编辑文本内容或者提醒自己日程。Mit-Cheetah-Note 还能理解自然语言,对语音指令做出准确的响应,从而提高用户的工作效率。 与其他语音助手相比,Mit-Cheetah-Note 的特点是其记事本功能。用户可以通过语音输入方式,较快地记录需要记下的信息,而无需手动键入。此外,Mit-Cheetah-Note 还有一个方便的搜索功能,可通过关键词搜索用户之前创建的笔记内容,帮助用户快速找到所需的信息。 Mit-Cheetah-Note 可以应用于多种场景,如商务会议、学术讲座、个人笔记等。它不仅可以减少记笔记的时间和工作量,还可以提高笔记的准确性和完整性。 总之,Mit-Cheetah-Note 是一种集成了语音助手和记事本功能的人工智能技术,使用户能够通过语音指令快速记录信息和管理日程,提高工作效率。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值