【论文笔记】视频物体检测(VID)系列 NoScope:1000x的视频检索加速算法

paper:https://arxiv.org/abs/1703.02529
code:https://github.com/stanford-futuredata/noscope

计算机视觉的进展,特别是近期深度神经网络的进展,使得在不断增长的视频数据中进行检索成为可能。但是,基于神经网络去做大规模视频检索,直接的问题就是计算量激增。比如现在最快的物体检测器能达到1~2.5x real time的效率(30~80fps),前提是买一个$4000的GPU。

我们来算一笔账,英伟达的K80 GPU,售价是$4000左右,处理视频的速度为50fps,那么跑1000h的视频(e.g., 25fps)就需要500h,P100 GPU更快一点,能达到80fps,也更贵$4600,跑1000h的视频需要312.5h。300~500h如果租云主机去处理的话($0.7~0.9/h)就是$300左右。

而现在图像和视频的传感器那么便宜,一个640*480的VGA CMOS传感器只要不到$0.65,这就造成了数据获取和数据处理开销的极大的不平衡,将近3个数量级的差异了。说明现在这个时代做视频相关的算法已经不是穷人可以玩的起的了。

所以斯坦福大学提出了NoScope,就是为了减小基于NN的video query的计算量而设计的系统ÿ

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值