视频分类原理
视频分类是指对连续的多张图片的连续行为进行类别的划分。假设我们有一张图片,图片中有一只猫,我们就可以训练一个简单的图片分类器去识别图片中的动物是不是猫,现在把一张图片换成连续100张图片(大约3s时长),进行识别,这就是视频分类。
视频分类应用
视频分类可以用在人体行为识别上,比如:
1、判断当前行为有无危险性(感觉检测也能做呢?)
2、判断视频直播行为是否带风险
3、想不出来了
视频分类领域开源数据
目前开源的数据有:UCF101、Kinetics-400/600/700、Something-Something V1/V2 、HMDB51 等。目前研究常用的数据集是Kinetics-400/600。庞大的数据集对于普通的炼丹玩家来说可能是灾难(对硬盘、网络和显卡都是巨大的挑战)。
视频分类开源模型
目前开源的模型比较多,像pytorch就提供预训练模型,新手玩家可以用来练手。常见的视频分类模型有C3D、X3D、Slowfast、Swim-transformer(目前CV、NLP领域都在用trabsformer,all you need)。
结尾
概述不想太啰嗦,就这样,拜拜!