lstm代码_轨迹预测03:social-lstm论文以及代码解析(上)

7e7f3c4c4ccfe0937b66c3c814b97c97.png

Social-lstm算是比较出名的行人轨迹预测方法了。2016年CVPR的论文,在这个领域已经算是比较古老的方法了,但是许多后续论文都是受到这篇文章的启发,被引量达到了120。想研究轨迹预测,这是相当不错的一个入门文章,而且网上的代码复现也比较齐全。这篇文章同时整合了行人自身轨迹和周围人群影响,把每个人看作lstm,在每个时刻把每个人周边的人的lstm隐状态拿出来做一个pooling, 这样就能体现这种动态的行人互动。

本文 Social LSTM: Human Trajectory Prediction in Crowded Spaces,来自

https://www.researchgate.net/publication/311611429_Social_LSTM_Human_Trajectory_Prediction_in_Crowded_Spaces​www.researchgate.net

1e13da357038534ce1145d859f7ca6f1.png

可以看到,黑色agent的lstm隐状态受到周围点的影响,这种影响通过s-pooling输入到下一阶段的lstm。

5188b1927543e2195606f4e1682edd29.png

h是上一阶段的隐状态,1mn[]是计算其他点是否处在在一定范围内的indicator。这个式子相当于点黑点周围相关点的隐状态收集起来了,黑点的新状态是h

a645227539868cd178b232c4b244ef02.png

其中e是坐标信息,a是周围人的状态。最后出来的高维向量符合双变量高斯分布,看来这个套路很符合轨迹预测,然后利用这个分布画轨迹热力图。下图是pooling的示意图

04539b66ab01b019610aa7ca30da1823.png

作为对比试验,作者只pooling周围点坐标进来(O-LSTM),结果发现可以实现agent被避碰,但是和ground truth还是有差距。如下是各种方法在不同数据库上的对比

37767909632d65d36078b413d9060402.png

可以看出在实时更新状态的过程中,预测会更接近ground truth(实线)

bad46ad9b8a8ced0534e0c5bb360991f.png

从下图可以看出来这个模型在某种情况下产生的错误预测。个人对想法:影响行人走动主要是行人眼前的东西,以行人为中心做pooling可能不是最好的办法,因为身后的人的速度方向都不会影响他,因此需要考虑这个人前方区域比如模拟视线的扇形做pooling才是更合理的选择,笔者打算亲自实战一番看一看是否能有改进。过两天会再写一个socisl-lstm代码的解读。

afe5c759f92cafde50d6c9a66ffd83d1.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值