累积最大奖励指标(Cumulative Max Reward)含义 简单概括:算法运行过程中所有历史解的最大值的变化曲线 比如算法第一次得到最优解为1.0,第二次得到了1.2,第三次得到了1.1,第四次得到了1.4. 那么累积最大奖励指标的变化就是: 1.0 → 1.2 → 1.2 → 1.4 1.0\to1.2\to1.2\to1.4 1.0→1.2→1.2→1.4