文末彩蛋:七月在线干货组最新升级的《2021大厂最新AI面试题 [含答案和解析, 更新到前121题]》免费送!
项目一:Interactive_ABCs_with_American_Sign_Language_using_Yolov5 —使用Yolov5通过计算机视觉提高聋人社区的可访问性
利用Yolov5,在美国手语字母上创建了一个自定义计算机视觉模型。该项目在社交平台上得到推广,以使数据集多样化。使用DropBox请求表在两周内总共收集了721张图像。为原始图像创建了手动标签,然后将其调整大小并进行预处理。对图像进行了几次精心选择的增强,以弥补少量数据集的不足。然后,总共使用了18,000张图像进行建模。将转移学习与Yolov5m权重结合在一起,并在163个小时内以300个纪元完成了训练,并且图像大小为1024。平均平均精度得分为0.8527。成功进行了推理测试,并确定了未来开发模型的优势和劣势。
为了解决可接受的推理速度和大小,选择了Yolov5进行建模。
该版本于今年6月10日发布,目前仍在积极开发中。尽管Ultralytics的Yolov5不是由最初的Yolo作者创建的,但据说Yolo v5更快,更轻便,其准确性与被普遍认为是最快,最准确的实时对象检测模型的Yolo v4相提并论。
Yolo被设计为用于实时物体检测的卷积神经网络。它比基本分类更为复杂,因为对象检测需要识别对象并定位图像上的位置。该单级