本周AI开源项目：最佳机器学习模板、Yolov5+CV提高聋人访问性

最新推荐文章于 2023-05-06 09:51:23 发布

niuyunpang

最新推荐文章于 2023-05-06 09:51:23 发布

阅读量345

点赞数

文章标签：算法计算机视觉机器学习人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/niuyunpang/article/details/119681637

版权

本文介绍了利用Yolov5创建的计算机视觉模型来帮助聋人社区，以及最佳实践机器学习项目模板ml-skeleton-py。还涉及其他项目，如OCNLI中文自然语言推理任务，基于PyTorch的音频信号处理库julius，以及使用Sum-Product网络的libspn-keras库。

摘要由CSDN通过智能技术生成

文末彩蛋：七月在线干货组最新升级的《2021大厂最新AI面试题 [含答案和解析, 更新到前121题]》免费送！

项目一：Interactive_ABCs_with_American_Sign_Language_using_Yolov5 —使用Yolov5通过计算机视觉提高聋人社区的可访问性

利用Yolov5，在美国手语字母上创建了一个自定义计算机视觉模型。该项目在社交平台上得到推广，以使数据集多样化。使用DropBox请求表在两周内总共收集了721张图像。为原始图像创建了手动标签，然后将其调整大小并进行预处理。对图像进行了几次精心选择的增强，以弥补少量数据集的不足。然后，总共使用了18,000张图像进行建模。将转移学习与Yolov5m权重结合在一起，并在163个小时内以300个纪元完成了训练，并且图像大小为1024。平均平均精度得分为0.8527。成功进行了推理测试，并确定了未来开发模型的优势和劣势。
在这里插入图片描述
为了解决可接受的推理速度和大小，选择了Yolov5进行建模。

该版本于今年6月10日发布，目前仍在积极开发中。尽管Ultralytics的Yolov5不是由最初的Yolo作者创建的，但据说Yolo v5更快，更轻便，其准确性与被普遍认为是最快，最准确的实时对象检测模型的Yolo v4相提并论。

Yolo被设计为用于实时物体检测的卷积神经网络。它比基本分类更为复杂，因为对象检测需要识别对象并定位图像上的位置。该单级

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。