【RL-GAN-Net】强化学习控制GAN网络,用于实时点云形状的补全。

  • 论文题目RL-GAN-Net: A Reinforcement Learning Agent Controlled GAN Network for Real-Time Point Cloud Shape Completion

作者及标题信息截图

所解决的问题

  用强化学习控制GAN网络,以使得GAN更快,更鲁棒。将其用于点云数据生成。全网第一次用RL控制GAN。通过数据驱动的方法填补三维数据中的数据缺失。

所采用的方法?

The forward pass of our shape completion network

  预训练阶段,训练一个自编码器,用于生成隐空间的表示,之后用这个去训练GAN网络。强化学习智能体用于选择合适的 z z z向量,去合成隐空间的表示。与之前的反向传播发现 z z z向量不同,本文采用RL的方法进行选择。

  主要由三个模块组成:1. 自编码器;2. l l l-GAN;3. 强化学习智能体(RL)。

自编码器

  自编码器用的损失函数如下:

d C H ( P 1 , P 2 ) = ∑ a ∈ P 1 min ⁡ b ∈ P 2 ∥ a − b ∥ 2 2 + ∑ b ∈ P 2 min ⁡ a ∈ P 1 ∥ a − b ∥ 2 2 d_{C H}\left(P_{1}, P_{2}\right)=\sum_{a \in P_{1}} \min _{b \in P_{2}}\|a-b\|_{2}^{2}+\sum_{b \in P_{2}} \min _{a \in P_{1}}\|a-b\|_{2}^{2} dCH(P1,P2)=aP1bP2minab22+bP2aP1minab22

  其中 P 1 P_{1} P1 P 2 P_{2} P2代表点云的输入和输出。

l l l-GAN

  结合GFV来训练GAN

  • Chamfer loss:

  输入点云数据 P i n P_{in} Pin和生成器和解码器输出数据 E − 1 ( G ( z ) ) E^{-1}(G(z)) E1(G(z))loss

L C H = d C H ( P i n , E − 1 ( G ( z ) ) ) L_{C H}=d_{C H}\left(P_{i n}, E^{-1}(G(z))\right) LCH=dCH(Pin,E1(G(z)))

  • GFV loss:生成CFV G ( z ) G(z) G(z)和输入点云 E ( P i n ) E(P_{in}) E(Pin)

L G F V = ∥ G ( z ) − E ( P i n ) ∥ 2 2 L_{G F V}=\left\|G(z)-E\left(P_{i n}\right)\right\|_{2}^{2} LGFV=G(z)E(Pin)22

  • Discriminator loss 判别器损失函数:

L D = − D ( G ( z ) ) L_{D}=-D(G(z)) LD=D(G(z))

网络结构

强化学习

  强化学习用于快速选择GAN生成器的输入 z z z

强化学习网络结构

  奖励函数定义为:

r = w C H ⋅ r C H + w G F V ⋅ r G F V + w D ⋅ r D r=w_{C H} \cdot r_{C H}+w_{G F V} \cdot r_{G F V}+w_{D} \cdot r_{D} r=wCHrCH+wGFVrGFV+wDrD

  其中 r C H = − L C H r_{CH}=-L_{CH} rCH=LCH r G F V = − l G F V r_{GFV}=-l_{GFV} rGFV=lGFV r D = − L D r_{D}=-L_{D} rD=LD。智能体用DDPG算法。

算法伪代码

取得的效果?

实验结果

与其它算法对比

奖励函数分析

参考资料

  相似文献

  • Panos Achlioptas, Olga Diamanti, Ioannis Mitliagkas, and Leonidas J. Guibas. Representation learning and adversarial generation of 3d point clouds. CoRR, abs/1707.02392, 2017. (有提到用隐空间数据训练GAN会更稳定)。

  相关GitHub链接

  • https://github.com/lijx10/SO-Net
  • https://github.com/heykeetae/Self-Attention-GAN
  • https://github.com/sfujim/TD3

我的微信公众号名称:小小何先生
公众号介绍:主要研究分享深度学习、机器博弈、强化学习等相关内容!期待您的关注,欢迎一起学习交流进步!

  • 1
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
《安富莱_STM32-V5开发板_RL-TCPnet网络教程(v1.0)》是一本关于安富莱公司推出的STM32-V5开发板和RL-TCPnet网络模块的教程资料。该教程的版本号为v1.0,主要介绍了如何在STM32-V5开发板上使用RL-TCPnet网络模块开发和实现网络通信功能。 教程的内容主要分为以下几个方面: 1. STM32-V5开发板介绍:对STM32-V5开发板的硬件特性和基本功能进行了详细介绍,包括主控芯片、存储器、通信接口等方面的信息。 2. RL-TCPnet网络模块介绍:对RL-TCPnet网络模块的特性和功能进行了详细说明,包括网络协议栈、TCP/IP协议、网络接口等方面的内容。 3. RL-TCPnet网络模块的使用:教程介绍了如何在STM32-V5开发板上进行RL-TCPnet网络模块的初始化和配置,包括网络模块的硬件连接、软件驱动的加载以及相关配置参数的设置等。 4. 网络通信的实现:教程详细介绍了如何使用RL-TCPnet网络模块实现各种网络通信功能,包括TCP连接、UDP通信、网络数据包的发送和接收等。 5. 实例代码和开发案例:教程提供了一些实例代码和开发案例,通过这些案例可以帮助开发者更好地理解和运用RL-TCPnet网络模块进行开发工作。 通过学习这本教程,读者可以了解并掌握如何在安富莱的STM32-V5开发板上使用RL-TCPnet网络模块进行网络通信的开发工作。教程结构清晰,内容详细,对于需要在嵌入式系统中实现网络通信功能的开发者来说是一份很有价值的指南。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值