【干货书】深度学习合成数据

最新推荐文章于 2025-03-30 12:37:30 发布

数据派THU

最新推荐文章于 2025-03-30 12:37:30 发布

阅读量582

点赞数

文章标签：机器学习人工智能深度学习 java python

原文链接：https://mp.weixin.qq.com/s?__biz=MzI1MjQ2OTQ3Ng==&mid=2247559484&idx=3&sn=7457f4163dd7f00e40e0f7e32c9a7222&chksm=e9e0e0b7de9769a183dfe96f79a4ba2b369cd23bc37234a45e350b9190ba6169cfd47921beca&scene=126&&sessionid=0

版权

来源：专知
本文为书籍，建议阅读8分钟
这是关于深度学习的合成数据的第一本书。

这是关于深度学习的合成数据的第一本书，其覆盖的广度可能使这本书成为未来几年合成数据的默认参考。这本书也可以作为介绍机器学习的其他几个重要的子领域，在其他书中很少触及。机器学习作为一门学科，如果没有手边的内部优化工作是不可能的。这本书包括了优化的必要的筋，尽管讨论的核心是训练深度学习模型的日益流行的工具，即合成数据。预计合成数据领域将在不久的将来经历指数增长。这本书是这一领域的全面综述。

在最简单的情况下，合成数据指的是用于训练计算机视觉模型的计算机生成图形。合成数据还有很多方面需要考虑。在基本计算机视觉部分，本书讨论了基本的计算机视觉问题，包括低级(如光流估计)和高级(如对象检测和语义分割)，户外和城市场景(自动驾驶)的合成环境和数据集，室内场景(室内导航)，航空导航和机器人仿真环境。此外，它还涉及了计算机视觉之外的合成数据的应用(在神经编程、生物信息学、NLP等方面)。它还调研了关于改进合成数据开发和生成它的替代方法(如GANs)的工作。

这本书介绍和回顾了机器学习各个领域合成数据的几种不同方法，最值得注意的是以下领域: 领域自适应，使合成数据更真实，和/或适应模型，以对合成数据进行训练，并为生成具有隐私保证的合成数据。这个讨论伴随着对生成式对抗网络(GAN)的介绍和对差分隐私的介绍。

https://link.springer.com/book/10.1007/978-3-030-75178-4#about