文章原址:
https://www.zybuluo.com/liuhui0803/note/644770
是以上迁移学习是为了解决,在训练每个案例是缺少大量的数据,但是同类的一些问题已经有通过大量的数据训练好模型。那么借助于这个模型构建一个新的模型。从这个角度说,更像是通过数据得到了一个learning system,非常有效的避免了过拟合;
具体的操作是,从可用的模型中找到输出结果可用的层。用这些层的输出结果作为输入,构建一个参数数量和规模都更加小的网络模型;这样可以学习到更加底层,通用化的规则,能够看到不同类型的数据,而且通过原有的模型,已经很好的掌握了数据背后的“规则”
但是对于文中的迁移学习训练所需的参数数量计算方式如下:
参数的数量 = [规模(输入) + 1] * [规模(输出) + 1]
= [2048+1]*[1+1]~ 4098 个参数
并不是特别的理解