来源:专知
本文为书籍,建议阅读8分钟
这是关于深度学习的合成数据的第一本书。
这是关于深度学习的合成数据的第一本书,其覆盖的广度可能使这本书成为未来几年合成数据的默认参考。这本书也可以作为介绍机器学习的其他几个重要的子领域,在其他书中很少触及。机器学习作为一门学科,如果没有手边的内部优化工作是不可能的。这本书包括了优化的必要的筋,尽管讨论的核心是训练深度学习模型的日益流行的工具,即合成数据。预计合成数据领域将在不久的将来经历指数增长。这本书是这一领域的全面综述。
在最简单的情况下,合成数据指的是用于训练计算机视觉模型的计算机生成图形。合成数据还有很多方面需要考虑。在基本计算机视觉部分,本书讨论了基本的计算机视觉问题,包括低级(如光流估计)和高级(如对象检测和语义分割),户外和城市场景(自动驾驶)的合成环境和数据集,室内场景(室内导航),航空导航和机器人仿真环境。此外,它还涉及了计算机视觉之外的合成数据的应用(在神经编程、生物信息学、NLP等方面)。它还调研了关于改进合成数据开发和生成它的替代方法(如GANs)的工作。
这本书介绍和回顾了机器学习各个领域合成数据的几种不同方法,最值得注意的是以下领域: 领域自适应,使合成数据更真实,和/或适应模型,以对合成数据进行训练,并为生成具有隐私保证的合成数据。这个讨论伴随着对生成式对抗网络(GAN)的介绍和对差分隐私的介绍。
https://link.springer.com/book/10.1007/978-3-030-75178-4#about
Front Matter
Introduction: The Data Problem
Deep Learning and Optimization
Deep Neural Networks for Computer Vision
Generative Models in Deep Learning
The Early Days of Synthetic Data
Synthetic Data for Basic Computer Vision Problems
Synthetic Simulated Environments
Synthetic Data Outside Computer Vision
Directions in Synthetic Data Development
Synthetic-to-Real Domain Adaptation and Refinement
Privacy Guarantees in Synthetic Data
Promising Directions for Future Work
Back Matter