![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
笔记
文章平均质量分 94
rca_finforc
这个作者很懒,什么都没留下…
展开
-
MPN (Learning Normal Dynamics in Videos with Meta Prototype Network)代码阅读
该论文通过在AE baseline上加入动态原型单元DPU,为不同的正常模式构建动态原型,每个常态原型编码场景的不同正常属性(diverse normal attributes)。该论文验证了动态原型建模正常模式分布的可行性。关键词:动态原型、注意力机制、端到端学习解决了什么问题:记忆模块需要大量内存,且无法处理在测试数据中新出现的场景。该论文的任务是:提取出正常模式的动态原型;视频异常检测。其中每种原型代表一种被记忆的场景元素,如下图:论文代码中表现出的总的结构如下所示1. 数据集加载预设原创 2022-06-22 09:19:59 · 1582 阅读 · 12 评论 -
Anomaly Detection (视频异常识别)
什么是异常识别异常样本将unintentional anomalies分类为:novel examplesout of distribution examplesin distribution examplesAdversarial examples(对抗样本:通过给正常样本加噪的方法构建,肉眼不一定可见。用于构建更有泛化能力的模型而引入。)应用计算机视觉、数据挖掘、自然语言处理等。视频监督异常检测。诈骗检测,网络侵入检测。医学异常检测,传感器网络异常检测。物联网大数据异常检测原创 2021-12-10 11:31:47 · 1840 阅读 · 0 评论 -
行为识别相关文献阅读
行为识别任务预测某个时间间隔上的行为。视频分类:预测整个视频的行为。图像分类器。难点严重依赖物体和场景。数据集带来的问题:骑马和跑步可以用有没有马来区分;遛狗和化学可以用背景区分。这也就导致了真正对动作去区分这么一个功能没做到。光流的问题:长度和语义。光流的帧数少难以描述长时间的动作。本身意义不明显,论文On the Integration of Optical Flow and Action Recognition提出了一个观点光流可能只是掩盖了外观信息。CNN擅长捕获物体和场景信息原创 2021-11-19 20:46:50 · 2500 阅读 · 0 评论 -
GST: Grouped Spatial-Temporal Aggregation for Efficient Action Recognition 论文阅读
Grouped Spatial-Temporal Aggregation for Efficient Action Recognition要解决的问题:作者对比了Kinetic和Diving48这两种类型的数据集。Kinetic通过静态场景和物体就可识别,甚至打乱顺序也没关系;而Diving48时序相关性较强,只用帧级别的推断是无法得到正确分类结果的。使用的方法:时间和空间两条并行的支路分别实现时序推理(获取动作信息)和外观信息捕捉(获取静态信息)。使用了分解的思路3×3×3→1×3×3+3×3×33原创 2021-10-30 14:44:07 · 885 阅读 · 0 评论