可以把dropout看成是一种ensemble方法,每次做完dropout相当于从原网络中找到一个更瘦的网络。强迫神经元和其他随机挑选出来的神经元工作,减弱了神经元节点间的联合适应性,增强泛化能力。使用Dropout得到更多的局部簇,同等数据下,簇变多了 ,因而区分性变大,稀疏性也更大。