Social-LSTM CVPR 2016阅读记录

最新推荐文章于 2024-04-27 09:47:32 发布

Y.Z.A

最新推荐文章于 2024-04-27 09:47:32 发布

阅读量600

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yangyoung1223/article/details/104867512

版权

Introduction

这个可以算是MX-LSTM的原型作了，主要贡献在于之前的做法都是用Social force为代表的人工方程来预测

前人已经有人考虑如何使用周边环境的信息来预测人们的行动，只不过他们都有以下两个缺点：
1）用的是自创的方程来建模人和人之间的互动
2）所关注的人之间的互动只包括了那些离得特别近以至于快要撞上的人，没能建模更多的人

然而LSTM有个问题，就是虽然它能处理一条长序列，但是不能找出多条序列之间的依赖关系，解决方法是建造一个Social的池化层，让这些有关系的每个人的LSTM在这里共享隐藏层

相关工作

Social Force 模型一度非常流行，效果也很好，但是不是数据驱动的，这里的方法是数据驱动的

另外的一些预测模型用的都是静态场景信息，这里是动态的人群互动

RNN及其变种LSTM对于时序任务处理非常有用

模型概述

为每个人设置一个LSTM，学习每个人不同的行动特征
然而如果这些LSTM不互相通讯，是不可能理解人和人之间的互动特征的，所以要搞一个公共的池化层
在这里插入图片描述

为了把周围所有个体的隐藏信息同时处理，引入一个Social的池化层，同时处理多个周围个体的隐藏状态，否则会因为一个一个处理而崩掉，池化方程如下
在这里插入图片描述
随后将坐标和收到的隐藏状态信息打包串接送入LSTM

位姿估计：t 时刻被估算的位置坐标服从高斯分布
在这里插入图片描述
loss function如下

实验

在ETH和UCY两个数据集下运行
使用
average displacement error,
final displacement error,
average non-linear displacement error三个来衡量
在检测中使用“留一法”
实际是看八帧，预测接下来的十二帧
UCY数据集下的表现要比ETH更好，因为UCY更为稠密，包括更多的人很多的区域，因为人多的条件下人们的动作更容易受到周围人的影响

Future Work

将Social-LSTM扩展到人、车等多种物体共同存在的场景中，每一类分配一个标签
Social-LSTM同时也能描述人和周围环境的互动，也许可以拿来搞事情

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。