图像识别开源_看看开源图像识别技术

最新推荐文章于 2024-08-13 15:44:11 发布

cumo3681

最新推荐文章于 2024-08-13 15:44:11 发布

阅读量4.2k

点赞数 2

文章标签：图像识别网络 python 人工智能编程语言

原文链接：https://opensource.com/article/18/5/state-of-image-recognition

版权

本文介绍了一位博士生如何利用开源的COCO数据集和YOLO对象检测系统，实现实时图像识别，展示了这项技术在生物医学成像和犯罪预防领域的应用。借助NVIDIA Jetson TX2模块，可以在边缘设备上进行实时视频分析，为各种应用场景提供便利。此外，还鼓励有兴趣的读者尝试使用带有网络摄像头的Raspberry Pi进行图像识别。

摘要由CSDN通过智能技术生成

图像识别开源

去年在丹佛举行的超级计算会议上，我走进展览馆时发现了一个有趣的项目。来自路易斯安那州立大学的一名博士生Shayan Shams建立了一个显示网络摄像头图像的大型监视器。图像上是带有标签的彩色框。当我靠近时，我意识到标签标识了桌子上的物体。

当然，我不得不玩。当我在桌子上移动每个对象时，其标签随之跟随。我将镜头外的一些物体移到了视野内，系统也识别了它们。

当我向Shams询问该项目时，得知他不需要编写任何代码来创建它就感到很惊讶-整个过程都来自开放软件和数据。 Shams使用上下文中的通用对象（COCO）数据集进行对象识别，从而减少了不必要的类以使其能够在功能较弱的硬件上运行。他解释说：“没有必要在SC展厅检测某些类，例如飞机，汽车，公共汽车，卡车等。” 为了进行实际检测，Shams使用了一次只看一次（YOLO）实时对象检测系统。

硬件是设置中唯一未打开的部分。 Shams使用了NVIDIA Jetson TX2模块来运行检测。 TX2被设计为充当AI推理的边缘设备（与计算强度更高的AI训练相反）。这款价格为300美元的设备使实时视频分析可以从中央计算资源中进行，这对于无人驾驶汽车等应用程序以及网络延迟或带宽限制需要在边缘进行计算的其他场景至关重要。

尽管此设置有趣地演示了实时图像识别的功能，但Shams的工作远远超出了简单识别笔和咖啡杯的能力。 Shams在LSU教授Seung-Jong Park的工作下，将他的研究应用于生物医学成像领域。在一个项目中，他将深度学习应用于乳腺摄影：通过分析乳腺摄影图像，医疗专业人员可以减少他们进行的不必要的活检数量。这不仅降低了医疗成本，而且节省了患者的压力。

Shams还在LSU的SmartCity项目中进行研究，该项目分析了巴吞鲁日交通摄像头的实时数据，以帮助发现抢劫和酒后驾车等犯罪活动。为了解决道德问题，Shams解释说，除检测到异常或犯罪活动的视频以外，所有视频均被丢弃。对于这些，针对特定车辆或人员的视频经过时间戳记，加密并保存在数据库中。该模型标记为可疑的任何视频都会经过两名现场系统管理员的审查，然后再发送给官员进行进一步调查。