? 拆分前传/反传路径&算子网络&参数/参数梯度 提出关键点在redu过程上,利用t-1的梯度信息来正则当前梯度 改进优化,将参数与参数梯度进行绑定优化 训练过程可逆 meta learning workflow 现工作(无修改的) 改动