【Posts阅读】关于 Deep Sets 和 Neural Processes的简单介绍

最新推荐文章于 2025-04-11 10:10:51 发布

土豆洋芋山药蛋

最新推荐文章于 2025-04-11 10:10:51 发布

阅读量4.2k

点赞数 9

分类专栏：论文阅读【Paper】文章标签： Deep Sets Neural Process

本文链接：https://blog.csdn.net/qq_33414271/article/details/108942592

版权

本文深入介绍了DeepSets和NeuralProcesses在元学习中的应用，特别是条件神经过程（CNPs）如何建模预测分布。讨论了元学习的背景，强调了数据效率和置换不变性在集合表示学习中的重要性。DeepSets通过求和分解实现置换不变性，为神经网络处理集合数据提供了一种方法。CNPs结合DeepSets，通过最大似然训练进行参数优化，展示出在小样本学习场景中的潜力。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

A Gentle Introduction to Deep Sets and Neural Processes

关于 Deep Sets 和 Neural Processes的简单介绍

Link: https://gordonjo.github.io/post/deepsets_nps/

Author:

Jonathan Gordon
Machine Learning PhD Student
My research interests include probabilistic machine learning, deep learning, and approximate Bayesian inference.

这篇博客中，作者谈了最近对Deep Sets 和 Neural Processes的理解，并在这篇文章中列出了这些模型的重要的组成的部分。作者主要关注 meta-learning，所以这篇文章也将从 meta-learning的背景介绍开始。

Quick Background on Meta-Learning

首先是（有监督的）meta-learning，在标准的有监督学习中，通常会比较关注学习/近似函数( $f$ )，此函数会建立输入( $x$ )和输出( $y$ )之间的映射。一个有监督的学习算法( $L$ )可以被认为是当给出上述的输入输出数据对，返回一个近似的函数( $\hat{f}$ )。如果( $L$ )是一个比较好的学习算法，那么在某种意义上 $\hat{f} \approx f$ 。

在met-learning中，面对的数据集不是一个很大的类似上面的数据集，而是由许多个任务组成的数据集，每个任务包含一个context set( $D_c$ )和target set( $D_t$ )（类似训练集和测试集）。每个集合中包含可变数量的输入输出数据对。面临假设是，尽管输入和输出之间的映射可能会因任务而有所不同，但任务共享一些统计属性，如果对其进行适当建模，则应会提高学习算法的整体性能。