本节总结:
动态规划是算法设计和优化方法,而非动态编程
动态规划强调大问题化小问题,且符合最优原则,子问题之间有重叠,并递归调用
类似斐波那契数列的解决方式
动态规划需要模型已知,而强化学习强调解决不确定性环境中的决策问题,你不需要确定所选算法模型,它会自动决策
本节总结:
动态规划是算法设计和优化方法,而非动态编程
动态规划强调大问题化小问题,且符合最优原则,子问题之间有重叠,并递归调用
类似斐波那契数列的解决方式
动态规划需要模型已知,而强化学习强调解决不确定性环境中的决策问题,你不需要确定所选算法模型,它会自动决策