DA(domain adaption):当训练集与测试集之间的分布有差异时,学习一个易于区别的分类器。
参考文章:unsupervised domain adaption by backpropogation
1、需求:
- 有标签的训练数据量较小;
- 训练集与测试集数据分布的偏移;
2、关键点:构建源域与目标域之间的映射关系;
3、previous domain adaption:worked with fixed feature representations。
4、本文特点:同时进行域适应学习与特征学习:
同时训练两个分类器:
- label predictor:预测标签的分类器;
- domain classifier:在训练时区分出训练集与测试集之间的特征的易于区分性;
- 迭代时的目标函数:
- 最小化label predictor分类器的loss函数:
- 最大化domain classifier分类器的loss函数:
5、目标:选出的特征具有一下属性:
- 特征具有易于区分的特性(discriminative)
- 特征对域的变化不敏感(domain invariant
6、一般用于衡量特征分布相似度的准则:
- match the distribution means in the kernel reproducing Hilbert space;
- map the principal axes associated with each of the distributions;
- match feature space distributions。
在判断特征之间的相似性时:最好通过modifying the feature representation itself rather than by reweighing or geometric transform。