AI审核视频--我们选择YOLOv8

最近接到一个任务:用AI审核视频,帮助发现视频中的问题,提高运营审核的生产力。

这应该属于计算机视觉(Computer Vision)的领域。

计算机视觉的主要目标是:复刻人类视觉的强大能力。

计算机视觉要解决的主要问题是:给出一张图片,计算机视觉系统必须识别出图像中的对象及其特征,如形状、纹理、颜色、大小、空间排列等,从而尽可能完整地描述该图像。

计算机视觉,跟图像处理、机器视觉是什么区分的呢?

图像处理

图像处理旨在处理原始图像以应用某种变换。其目标通常是改进图像或将其作为某项特定任务的输入,而计算机视觉的目标是描述和解释图像。例如,降噪、对比度或旋转操作这些典型的图像处理组件可以在像素层面执行,无需对图像整体具备全面的了解。

机器视觉

机器视觉是计算机视觉用于执行某些(生产线)动作的特例。在化工行业中,机器视觉系统可以检查生产线上的容器(是否干净、空置、无损)或检查成品是否恰当封装,从而帮助产品制造。

计算机视觉

计算机视觉可以解决更复杂的问题,如人脸识别、详细的图像分析(可帮助实现视觉搜索,如 Google Images),或者生物识别方法。

计算机视觉的常见任务有:

图像分类,目标检测,实例分割,如下图(分别对应classification、detection、segmentation)

当然,还有其他任务,例如:目标识别,目标追踪,语义分割等。

计算机视觉的一些商用案例,如下:

  • Google的图片搜索
  • Facebook的人脸识别
  • 特斯拉的自动驾驶(Autopilot)
  • 微软 InnerEye ,从恶性肿瘤的 3D 图像中准确识别出肿瘤。这是一项伟大的案例,值得一张配图来演示:

动图封面

回到视频审核任务,该怎么做呢?

可以把视频逐帧切图,然后做图像分类,目标检测似乎更好,可以直接指出问题所在。

图像分类

常用算法:KNN、SVM、BP 神经网络、CNN 和迁移学习

常用数据集:ImageNet、MNIST、Caltech 101

目标检测

目前常用的目标检测算法有R-CNN(速度慢,过程繁琐,训练所需空间大)、Faster R-CNN(比前者更准确、快速、简便,但还是不够快,不够简洁)和基于YOLO的目标检测的算法(速度快,泛化能力强,但精度低,小目标和邻近目标检测效果差,比Fast R-CNN定位误差大一些)

常用数据集:PASCAL VOL、MS COCO、ImageNet

看来,选择YOLO没错。

YOLO(You Only Look Once)是一种流行的物体检测和图像分割模型,由华盛顿大学的约瑟夫-雷德蒙(Joseph Redmon)和阿里-法哈迪(Ali Farhadi)开发。YOLO 于 2015 年推出,因其高速度和高精确度而迅速受到欢迎。

物体检测,目标检测,应该都是翻译自object classification,不同译法而已。

YOLOv8是YOLO 的最新版本,由Ultralytics 提供。YOLOv8 YOLOv8 支持全方位的视觉 AI 任务,包括分类、检测、分割、追踪、姿势估计和OBB(定向边框对象检测)。这种多功能性使用户能够在各种应用和领域中利用YOLOv8 的功能。

最后的OBB(定向边框对象检测)是什么?

定向物体检测比物体检测更进一步,它引入了一个额外的角度来更准确地定位图像中的物体。

定向物体检测器的输出结果是一组旋转的边界框,这些边界框精确地包围了图像中的物体,同时还包括每个边界框的类标签和置信度分数。

请看下图就一目了然了。

好了,今天就到这里。

后面我们还有两篇,分别是:

YOLOv8入门篇--YOLOv8的安装和使用

YOLOv8进阶篇--先训练模型,然后检测视频

  • 5
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值