之前看模拟退火法的原理,一直以为状态更新需要按照梯度下降 今天看前辈代码,发现她就是按照温度更新步长从而获得新状态 于是再看了一遍SA原理,关键就是贪心+概率接受更差解,不需要通过梯度确定更新方向 还挺神奇的,有时间可以自己写一个小程序试试