欢迎大家关注我的B站:
偷吃薯片的Zheng同学的个人空间-偷吃薯片的Zheng同学个人主页-哔哩哔哩视频 (bilibili.com)
目录
1.引入LLM的背景
- 基于学习的智驾系统需要复杂的rule或reward设计,一旦依赖预定义又会出现泛化能力弱的情况,对corner case 的效果不好,最终沦为一个需要不断改进的补丁系统。
- 有限的数据集和采样效率会导致long-tail problem,corner case样本数量少将导致训练出来的策略并不是最优的
欢迎大家关注我的B站:
偷吃薯片的Zheng同学的个人空间-偷吃薯片的Zheng同学个人主页-哔哩哔哩视频 (bilibili.com)
目录