论坛主题
主动目标跟踪专题
论坛简介
主动目标跟踪是指智能体根据视觉观测信息主动地移动相机,从而与目标保持特定距离和角度。主动目标跟踪在很多实际任务中都有需求,如无人机跟拍,无人车编队,智能监控等。然而,传统的实现方法是将图像中的目标跟踪和相机控制分成两个独立的任务,这导致系统在进行联调优化时变得繁琐复杂。此外,要单独实现这两个任务的代价也是高昂的,既需要大量人工标注目标位置用于训练跟踪模块,也需要在真实系统中通过试错整定控制器参数。本期论坛我们邀请到了来自北京大学信息科学技术学院的博士研究生钟方威同学,介绍他提出一种基于深度强化学习训练端到端模型的解决方案。
论坛讲者
钟方威
钟方威,北京大学信息科学与技术学院计算机应用专业在读博士生,导师王亦洲教授。主要研究方向是自主学习及其在机器人视觉中的应用。已有8篇论文在人工智能领域知名国际会议及期刊发表,如TPMAI, ICLR, ICML, CVPR, AAAI等。同时,担任多个顶级国际会议程序委员/审稿人,包括NeurIPS, ICML, ICLR, CVPR, ICCV, ECCV, AAAI等。
报告题目:基于强化学习的端到端主动目标跟踪研究
报告摘要:主动目标跟踪是指智能体根据视觉观测信息主动地移动相机,从而与目标保持特定距离和角度。主动目标跟踪在很多实际任务中都有需求,如无人机跟拍,无人车编队,智能监控等。然而,传统的实现方法是将图像中的目标跟踪和相机控制分成两个独立的任务,这导致系统在进行联调优化时变得繁琐复杂。此外,要单独实现这两个任务的代价也是高昂的,既需要大量人工标注目标位置用于训练跟踪模块,也需要在真实系统中通过试错整定控制器参数。为了解决上述问题,本文提出一种基于深度强化学习训练端到端模型的解决方案,包括了定义奖赏函数,仿真环境构建,环境增强技术,目标-跟踪器对抗训练机制等。
Spotlight:
第一个实现基于深度强化学习的端到端主动目标跟踪,性能超过传统方法;
构建了用于主动目标跟踪训练和测试的虚拟仿真环境;
提出了针对主动目标跟踪的环境增强技术,可显著提升模型泛化能力;
提出了一种智能体对抗训练机制,可进一步提高模型训练效率和鲁棒性。
召集人
曹志崴
曹志崴,北京大学信息科学技术学院硕士研究生,主要研究方向为机器学习在无线通信中的应用。
论文推荐
“ 本期推荐的文章主要关注于计算机视觉的目标跟踪领域,你可以认真阅读讲者推荐的论文,来与讲者及同行线上交流哦。