学习域适应之前比较陌生的是在迁移学习中边缘概率分布和条件概率分布有什么含义?(参考王晋东大佬和一些知乎上的回答):
边缘概率就是P(x),指的是产生数据的分布。条件概率是P(y|x),就是数据和标签之间的后验概率分布,和学习任务有关。
1.为什么要在迁移学习中研究这两个分布?
迁移学习中最重要是就是领域自适应问题,目的希望源域中用大量有标签数据训练好的模型能够更好的在目标域中泛化,而目标域中只有少量或者无标注的数据(一个比较容易理解的例子是用公开数据集训练好的模型来初始化网络,然后再用少量的数据进行fine-tunning),所以要解决的问题就是源域和目标域的数据分布不一定相同,数据分布用联合概率来表示
又因为p(x,y) = p(x|y)p(y) = p(y|x)p(x), 所以转为研究边缘概率分布和条件概率分布。
2.数据分布不一致有哪些情况?如何理解其中的边缘概率分布和条件概率分布含义?
用一个猫狗分类的例子来理解