- 用途:domain差别较大的数据集之前联合训练的方法
- 方法:同一个backbone,不同的classifier(2 fc branch),loss梯度分别回传,分别更新。大的数据集训练n 个batch,小的数据集训练1个batch
- lr steps的确定:根据实现而不同。一种是将两种数据集中的样本数量加总之后计算总的数据量,然后根据 10,20,30个epoch去就计算lr每次下降所需的训练steps个数
Loss nan的问题:
joint learning
最新推荐文章于 2024-01-08 22:22:54 发布