总体流程图
迁移学习
内容主体是迁移学习,迁移学习的适用环境是
目标任务领域的数据(或者说有标注的数据)不足,不能支撑模型从零开始训练到收敛的状态;同时,在类似的领域上,有一个已有大量数据的,训练完备的模型;这时就可以利用已有的模型,对现有的问题解决,提供一定的帮助
总结一下,迁移学习需要两个前提
1.源领域的样本足够多,足够大
2.源领域和目标领域的样本足够相似(这里的相似需要独特的解释)
本文中对于相似的理解是,两个领域的特征领域一致,特征分布一致,就称两个领域相似
迁移学习的好处是,利用已有的模型,对于新的需要解决的类似的问题提供帮助
节省时间:模型不用从头开始训练,计算量少,收敛速度快
节省数据:模型是迁移过来的,不需要目标领域太多的数据,解决了数据荒的问题
缺点主要是不一定能找到符合特定“相似”条件的源领域模型,即使找到