参考https://sdsy888.blog.csdn.net/article/details/103884586?utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromMachineLearnPai2%7Edefault-1.control&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromMachineLearnPai2%7Edefault-1.control
requires_grad控制梯度计算,eval控制dropout层停止drop和BN层停止计算均值和方差,但无法控制梯度计算,因此在eval模式下,再加个with_no_grad可以节省计算