Social lstm: Human trajectory prediction in crowded spaces

由于Dense-Captioning Events in Videos中的captioning模块借鉴的是这篇文章,所以浅浅看了一下这篇文章。这篇文章主要目的是预测行人在未来时刻的运动轨迹,特别是在复杂的社交互动场景中,如行人避让、绕行和调整路径等,将轨迹预测问题视为一个序列生成任务。

1.介绍

传统的轨迹预测方法,如“社交力模型”(Social Force Model),使用手工设计的规则来模拟人之间的互动行为,但这些方法有两个主要问题:手工设计规则的局限性,这些方法需要对具体场景进行特殊的建模,难以泛化到复杂的场景;只能考虑邻近的互动,传统方法只能处理近距离的行人之间的即时互动,无法预测未来可能发生的远距离互动。

受到LSTM在不同序列预测任务(比如手写和语音生成)中取得成功的启发,提出该架构,引入一个"社交"池化层,主要是允许空间邻近序列的LSTM共享其隐藏状态。

2.模型

为轨迹预测问题开发了一个基于LSTM模型,场景中每个人的历史位置信息通过一个独立的LSTM网络进行建模和预测,通过引入社交池化层,相邻的LSTM网络可以共享其隐藏状态,这使得模型可以学习到人与人之间的交互。例如,当一个行人避开另一个行人时,他们的LSTM会通过池化层交换信息,帮助模型更好地预测未来的轨迹。基于概率分布进行轨迹预测,模型通过学习后,预测每个行人的未来位置,并通过高斯分布来描述这些位置的不确定性。

LSTM的权重在所有序列之间共享,通过新的池化策略连接相邻的LSTM,实现共享隐藏状态。最小化训练数据集中所有轨迹的损失来训练模型。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值