综述:什么是光流及其在深度学习中的应用
在现实生活中,那个人不会接触到视频呢?就拿每天使用的微信来说,朋友发送给你的短视频,朋友圈的视频,或者是抖音的搞笑小视频等等,亦或者E盘里面的苍老师。对于视频平台,总会遇到一个问题,如何在没有人工干预的情况下让系统知道用户上传的视频描述了什么?或者,具体点,系统怎么知道你有没有上传爱情动作片,传播不雅视频给大众?今天我们来看看这个问题。
视频与图像有很大的差别,视频除了具有图像中的空间结构外,还具有时间结构。视频也具有他图像不具有的信息,例如声音,但是我们本文暂时忽略这点。视频只是在特定时间分辨率(即每秒帧数)下运行的图像集合。这意味着视频中的信息不仅在空间上(即在视频中的对象或人物中)进行编码,而且还按照特定顺序依次进行编码,例如接球vs扔球,跳舞vs拥抱。这些额外的信息使视频分类非常有趣,同时又充满挑战。