一、理论基础 1.1值函数 1.2策略搜索 二、逆强化学习概述与经典方法 2.1基于确定基函数组合的反馈信号函数(逆强化学习的基础) 2.2基于参数化模型的反馈信号函数 FIRL GP-IRL DGP-IRL 最大熵逆强化学习 贝叶斯逆强化学习(BIRL) 深度逆强化学习(DeepIRL) 2.3其他函数表示形式 三、基于逆强化学习的示教学习方法与应用 3.1学徒学习 3.2代价指导学习