AI审核视频--我们选择YOLOv8

goggle1

已于 2024-04-03 16:44:13 修改

阅读量964

点赞数 5

文章标签：人工智能 YOLO

于 2024-04-03 16:38:45 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gogglex1/article/details/137350445

版权

最近接到一个任务：用AI审核视频，帮助发现视频中的问题，提高运营审核的生产力。

这应该属于计算机视觉（Computer Vision）的领域。

计算机视觉的主要目标是：复刻人类视觉的强大能力。

计算机视觉要解决的主要问题是：给出一张图片，计算机视觉系统必须识别出图像中的对象及其特征，如形状、纹理、颜色、大小、空间排列等，从而尽可能完整地描述该图像。

计算机视觉，跟图像处理、机器视觉是什么区分的呢？

图像处理

图像处理旨在处理原始图像以应用某种变换。其目标通常是改进图像或将其作为某项特定任务的输入，而计算机视觉的目标是描述和解释图像。例如，降噪、对比度或旋转操作这些典型的图像处理组件可以在像素层面执行，无需对图像整体具备全面的了解。

机器视觉

机器视觉是计算机视觉用于执行某些（生产线）动作的特例。在化工行业中，机器视觉系统可以检查生产线上的容器（是否干净、空置、无损）或检查成品是否恰当封装，从而帮助产品制造。

计算机视觉

计算机视觉可以解决更复杂的问题，如人脸识别、详细的图像分析（可帮助实现视觉搜索，如 Google Images），或者生物识别方法。

计算机视觉的常见任务有：

图像分类，目标检测，实例分割，如下图（分别对应classification、detection、segmentation）

当然，还有其他任务，例如：目标识别，目标追踪，语义分割等。

计算机视觉的一些商用案例，如下：

Google的图片搜索
Facebook的人脸识别
特斯拉的自动驾驶(Autopilot)
微软 InnerEye ，从恶性肿瘤的 3D 图像中准确识别出肿瘤。这是一项伟大的案例，值得一张配图来演示：

动图封面

回到视频审核任务，该怎么做呢？

可以把视频逐帧切图，然后做图像分类，目标检测似乎更好，可以直接指出问题所在。

图像分类

常用算法：KNN、SVM、BP 神经网络、CNN 和迁移学习

常用数据集：ImageNet、MNIST、Caltech 101

目标检测

目前常用的目标检测算法有R-CNN（速度慢，过程繁琐，训练所需空间大）、Faster R-CNN（比前者更准确、快速、简便，但还是不够快，不够简洁）和基于YOLO的目标检测的算法（速度快，泛化能力强，但精度低，小目标和邻近目标检测效果差，比Fast R-CNN定位误差大一些）

常用数据集：PASCAL VOL、MS COCO、ImageNet

看来，选择YOLO没错。

YOLO(You Only Look Once）是一种流行的物体检测和图像分割模型，由华盛顿大学的约瑟夫-雷德蒙（Joseph Redmon）和阿里-法哈迪（Ali Farhadi）开发。YOLO 于 2015 年推出，因其高速度和高精确度而迅速受到欢迎。

物体检测，目标检测，应该都是翻译自object classification，不同译法而已。

YOLOv8是YOLO 的最新版本，由Ultralytics 提供。YOLOv8 YOLOv8 支持全方位的视觉 AI 任务，包括分类、检测、分割、追踪、姿势估计和OBB（定向边框对象检测）。这种多功能性使用户能够在各种应用和领域中利用YOLOv8 的功能。

最后的OBB（定向边框对象检测）是什么？

定向物体检测比物体检测更进一步，它引入了一个额外的角度来更准确地定位图像中的物体。

定向物体检测器的输出结果是一组旋转的边界框，这些边界框精确地包围了图像中的物体，同时还包括每个边界框的类标签和置信度分数。

请看下图就一目了然了。

好了，今天就到这里。

后面我们还有两篇，分别是：

《YOLOv8入门篇--YOLOv8的安装和使用》

《YOLOv8进阶篇--先训练模型，然后检测视频》

关注

5
点赞
踩
19

收藏

觉得还不错? 一键收藏
2
评论
AI审核视频--我们选择YOLOv8

目前常用的目标检测算法有R-CNN（速度慢，过程繁琐，训练所需空间大）、Faster R-CNN（比前者更准确、快速、简便，但还是不够快，不够简洁）和基于YOLO的目标检测的算法（速度快，泛化能力强，但精度低，小目标和邻近目标检测效果差，比Fast R-CNN定位误差大一些）计算机视觉要解决的主要问题是：给出一张图片，计算机视觉系统必须识别出图像中的对象及其特征，如形状、纹理、颜色、大小、空间排列等，从而尽可能完整地描述该图像。当然，还有其他任务，例如：目标识别，目标追踪，语义分割等。
复制链接

扫一扫

goggle1 CSDN认证博客专家 CSDN认证企业博客

码龄17年

7: 原创

63万+: 周排名

12万+: 总排名

6568: 访问

: 等级

159: 积分

41: 粉丝

65: 获赞

6: 评论

49: 收藏

私信

关注

热门文章

分类专栏

Linux 2篇

最新评论

音频转文本--我们选择faster-whisper
zhangzijie456: Loading faster whisper model large-v2 for device None 老哥你好，我想问一下到这里就不动了，一直卡在这里是这么回事，是我的云服务器配置太低了吗
AI审核视频--我们选择YOLOv8
普通网友: 干货满满！我也写了一篇获取【大厂面试真题解析、核心开发学习笔记、最新全套讲解视频、实战项目源码讲义、学习路线简历模板】的文章
AI审核视频--我们选择YOLOv8
CSDN-Ada助手: 恭喜用户在AI审核视频方面取得了进展，选择了YOLOv8这一先进的技术。希望用户能够继续坚持不懈地创作，为AI技术的发展贡献自己的力量。下一步建议可以考虑探索更多视频审核领域的应用，不断拓展自己的技术视野，相信用户一定能取得更大的成就。期待用户的下一篇作品！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
YOLOv8入门篇--YOLOv8的安装和使用
CSDN-Ada助手: 恭喜作者成功发布了第5篇博客《YOLOv8入门篇--YOLOv8的安装和使用》！不断分享学习成果是一个很好的习惯，也能够帮助他人更好地理解和应用相关知识。接下来，或许可以考虑深入探讨YOLOv8的优缺点、应用场景、性能优化等方面的内容，这样可以使读者更全面地了解这一技术。期待您的下一篇作品！祝您写作愉快！
YOLOv8进阶篇--训练模型，然后检测视频
CSDN-Ada助手: 恭喜作者发布了第6篇博客，内容涵盖了YOLOv8的进阶篇，介绍了训练模型和检测视频的过程。持续创作不易，感谢作者的辛勤努力！希望作者在下一篇博客中可以深入探讨YOLOv8的应用场景和优化方法，期待更多精彩内容的呈现。加油！

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。