1.drop是为了避免模型过拟合而提出来的,dropout的神经元对下游神经元不做贡献,反向传播史对应的权重也不更新。举个例子,自然界无性繁殖保留的大段的连续基因,有性繁殖将基因进行拆了又拆破坏了基因的联合适应性,但是自然界选择了有性繁殖说明其更强,同样的道理dropout一部分神经元后,破坏其联合适应性,迫使其他神经元去介入代替缺失的神经元的那部分特征。普遍认为这种网络模型会得到更多的内部特征因此提升了模型的泛化能力,不容易对训练数据过拟合。
关键字: 正则化 联合适应性 随机挑选 泛化能力 特定权重