- 博客(2)
- 收藏
- 关注
原创 POMDP做自动驾驶决策算法的思路
本文整理一下个人对基于POMDP深度强化学习的方法做自动驾驶决策算法的一些理解。 在EUDM和MPDM等自动驾驶决策算法中,都提到了Forward Simulation前向搜索的过程,该过程可以在Alpha Go & Alpha Zero中的MCTS蒙特卡洛树搜索算法中获得启发。 前向搜索过程每一步都要罗列出全部的可能的决策,即使某种决策的概率很小。 而MCTS可以通过减小搜索广度和深度,来有效降低前向搜索的复杂度。MCTS中评价动作 a 好坏的公式为其中,表示动作
2024-07-02 22:23:40 743 2
原创 时空联合规划-三维空间DP搜索
本文记录个人对时空联合规划的整体思路,包括决策、规划、优化的过程,也包括使用rosbag录制的实车数据在本地回归的Rviz效果,最后还会记录一些重点问题及其解决办法。
2024-06-30 09:01:24 787
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人