论文：Object-centric Auto-encoders and Dummy Anomalies for Abnormal Event Detection in Video阅读遇到的问题及解答

最新推荐文章于 2022-05-09 20:46:26 发布

cuixianheng

最新推荐文章于 2022-05-09 20:46:26 发布

阅读量816

点赞数 2

分类专栏：论文阅读文章标签：深度学习计算机视觉神经网络 pytorch

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cuixianheng/article/details/107570428

版权

论文阅读专栏收录该内容

1 篇文章 0 订阅

订阅专栏

论文链接：https://arxiv.org/abs/1812.04960

1、为什么叫以对象为中心？

使用目标检测将感兴趣的对象裁剪出来，然后对裁剪之后的图像进行操作。

2、提出的无监督框架训练数据是什么（只是正样本还是正样本负样本都有）？无监督框架是什么样的？

首先使用在COCO数据集上预训练的FPN对每帧进行目标检测，提取出感兴趣的对象。训练数据是使用提取出的感兴趣对象，只是正常样本。无监督框架包含三个卷积自编码器，有两个提取运动信息，一个提取外观信息，运动卷积自编码器输入数据是裁剪后的感兴趣对象的梯度，该梯度分别是[t,t-3],[t,t+3]时刻梯度的融合，外观卷积自编码器输入数据是t时刻的裁剪后的感兴趣对象图片。CAE输入图片大小是64641，每个自编码器的输出都是1024长度的特征向量，模型输出的特征向量总长度是3072，自编码器训练时使用均方误差损失函数。输出的特征向量再用来聚类。

3、进行聚类时聚类数目怎么选择？聚类使用哪种方法？是对重构后的特征聚类吗？

做了消融实验，{5,10,15,20,25,30}，最后当k=10时效果最好。聚类使用kmeans，使用kmeans++进行初始化，是对无监督框架中那三个卷积自编码器提取的隐藏层特征进行聚类。

4、训练一对多分类器是怎么训练的？分类器的输出是什么？输出怎么与异常挂钩？

分类器的输出是标量值，是分类分数，如果一个测试样本的分类器输出的最高分类分数是正数，则这个样本属于正常事件，如果最高分数为负数，则代表该样本不属于任何一类正常事件，所以它属于异常事件。

5、该方法在各个数据集上的表现怎么样？有什么优缺点？

在各个数据集上的表现都优于当下最好的异常事件检测模型。缺点是当检测目标的包围框中有两个及以上目标时，容易出现假阳性。

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
论文：Object-centric Auto-encoders and Dummy Anomalies for Abnormal Event Detection in Video阅读遇到的问题及解答

论文链接：https://arxiv.org/abs/1812.049601、为什么叫以对象为中心？使用目标检测将感兴趣的对象裁剪出来，然后对裁剪之后的图像进行操作。2、提出的无监督框架训练数据是什么（只是正样本还是正样本负样本都有）？无监督框架是什么样的？首先使用在COCO数据集上预训练的FPN对每帧进行目标检测，提取出感兴趣的对象。训练数据是使用提取出的感兴趣对象，只是正常样本。无监督框架包含三个卷积自编码器，有两个提取运动信息，一个提取外观信息，运动卷积自编码器输入数据是裁剪后的感兴趣对象的梯
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。