【RL-GAN-Net】强化学习控制GAN网络，用于实时点云形状的补全。

小小何先生

已于 2024-02-24 22:45:01 修改

阅读量2.3k

点赞数 1

分类专栏：顶会期刊论文阅读笔记文章标签：生成对抗网络人工智能神经网络

于 2020-04-18 18:33:09 首次发布

本文链接：https://blog.csdn.net/weixin_39059031/article/details/105592236

版权

顶会期刊论文阅读笔记专栏收录该内容

37 篇文章 22 订阅

订阅专栏

文章目录

论文题目：RL-GAN-Net: A Reinforcement Learning Agent Controlled GAN Network for Real-Time Point Cloud Shape Completion

作者及标题信息截图

所解决的问题

用强化学习控制GAN网络，以使得GAN更快，更鲁棒。将其用于点云数据生成。全网第一次用RL控制GAN。通过数据驱动的方法填补三维数据中的数据缺失。

所采用的方法？

The forward pass of our shape completion network

预训练阶段，训练一个自编码器，用于生成隐空间的表示，之后用这个去训练GAN网络。强化学习智能体用于选择合适的 $z$ 向量，去合成隐空间的表示。与之前的反向传播发现 $z$ 向量不同，本文采用RL的方法进行选择。

主要由三个模块组成：1. 自编码器；2. $l$ -GAN；3. 强化学习智能体(RL)。

自编码器

自编码器用的损失函数如下：

$d_{C H}\left(P_{1}, P_{2}\right)=\sum_{a \in P_{1}} \min _{b \in P_{2}}\|a-b\|_{2}^{2}+\sum_{b \in P_{2}} \min _{a \in P_{1}}\|a-b\|_{2}^{2}$

其中 $P_{1}$ 和 $P_{2}$ 代表点云的输入和输出。

$l$ -GAN

结合GFV来训练GAN。

Chamfer loss:

输入点云数据 $P_{in}$ 和生成器和解码器输出数据 $E^{-1}(G(z))$ 做loss：

$L_{C H}=d_{C H}\left(P_{i n}, E^{-1}(G(z))\right)$

GFV loss：生成CFV $G (z)$ 和输入点云 $E(P_{in})$

$L_{G F V}=\left\|G(z)-E\left(P_{i n}\right)\right\|_{2}^{2}$

Discriminator loss 判别器损失函数：

$L_{D}=-D(G(z))$

网络结构

强化学习

强化学习用于快速选择GAN生成器的输入 $z$ ：

强化学习网络结构

奖励函数定义为：

$r=w_{C H} \cdot r_{C H}+w_{G F V} \cdot r_{G F V}+w_{D} \cdot r_{D}$

其中 $r_{CH}=-L_{CH}$ ， $r_{GFV}=-l_{GFV}$ ， $r_{D}=-L_{D}$ 。智能体用DDPG算法。

算法伪代码

取得的效果？

实验结果

与其它算法对比

奖励函数分析

参考资料

相似文献：

Panos Achlioptas, Olga Diamanti, Ioannis Mitliagkas, and Leonidas J. Guibas. Representation learning and adversarial generation of 3d point clouds. CoRR, abs/1707.02392, 2017. (有提到用隐空间数据训练GAN会更稳定)。

相关GitHub链接：

https://github.com/lijx10/SO-Net
https://github.com/heykeetae/Self-Attention-GAN
https://github.com/sfujim/TD3

我的微信公众号名称：小小何先生
公众号介绍：主要研究分享深度学习、机器博弈、强化学习等相关内容！期待您的关注，欢迎一起学习交流进步！

小小何先生

关注

1
点赞
踩
20

收藏

觉得还不错? 一键收藏
1
评论
【RL-GAN-Net】强化学习控制GAN网络，用于实时点云形状的补全。

文章目录所解决的问题背景所采用的方法？取得的效果？所出版信息？作者信息？参考资料论文题目：RL-GAN-Net: A Reinforcement Learning Agent Controlled GAN Network for Real-Time Point Cloud Shape Completion所解决的问题用强化学习控制GAN网络，以使得GAN更快，更鲁棒。将其用于点云数...
复制链接

扫一扫