干货分享 | MindSpore21天实战营手记（四）：基于YOLOV3-DarkNet50的篮球检测模型

最新推荐文章于 2024-06-26 00:34:18 发布

昇思MindSpore

最新推荐文章于 2024-06-26 00:34:18 发布

阅读量613

点赞数

分类专栏：技术博客文章标签：人工智能深度学习图像处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Kenji_Shinji/article/details/126584562

版权

技术博客专栏收录该内容

416 篇文章 55 订阅

订阅专栏

本次课程作业要求输入一张篮球比赛的图片，识别运动员的动作，并作出标。其实实战营第一课的进阶作业就编译了一个目标检测APP。我用那个小程序识别了一张小猫对着手枪举起俩前爪的图片。结果小猫识别对了，手枪被识别成了吹风机。

我觉得视频目标检测非常神奇，因为一张图片上可能有很多东西，它是怎么会把目标认出来呢？今天的模型更强悍，不但要识别对象，还要识别出动作。

听了老师的讲解，我终于知道了检测模型底层是怎么运作的——原来在识别之前需要一个标注的过程，由人框出目标，并给目标赋予属性。这个过程目前还没办法依靠机器自动完成。标注完成之后才会进入到训练和推理等后续环节。

课程回看：

https://www.bilibili.com/video/BV1PT4y1c7gp

作业过程

有了前两节课的作业经历，ModelArts的操作套路已经很熟悉，加上老师提供的作业指南（附后）说明很详细，完成本次课程的作业并不困难。

而且今天ModelArts公测环境非常给力，提交之后几乎不需要排队，几分钟就输出结果，所以用小半天的时间就完成了作业。

体验作业：输入图片，利用已经训练好的模型进行动作检测。
进阶作业：将输入视频分解为帧图像，再把帧图像重组为输出视频。

进阶作业稍微复杂一些，首先是视频获取的问题。本次课与以前课程不太一样的地方，就是需要自己找数据了。我感觉网上找的比赛视频片段都不够清晰。最后选择了一段央视网体育频道的一场比赛录像，用EVCapture录制了20秒左右的片段，保存成1280*720的MP4文件。

其次是作业指南中的视频转换参考脚本提示了关键步骤，需要补全代码才能完全从视频到图片的转换。我没用过opencv，因而用jupyter notebook（附后）分步执行，能够观察每一步执行结果，出了什么错能立马就知道。我感觉这些工具对于完成作业非常有帮助。

昇思MindSpore

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。