权重衰退(比较常见的解决过拟合的方法) 为什么叫权重衰退? 实现 =0过拟合 p的概率变成0,1-p的概率相应的放大 h是结果,对得到的每个结果做一个dropout 训练模型的时候使用正则项,推理的时候就不用了 使用乘法,而不直接赋值(x[mask]=0)的原因是GPU乘法的计算更加fast