分析计算机视觉模型的性能

本文介绍了FiftyOne,一个用于数据集标记和计算机视觉模型分析的开源工具,强调其在提高数据质量和理解模型故障模式方面的价值。通过实例展示了如何使用FiftyOne进行数据集创建、样本管理、模型性能评估,包括分类报告和混淆矩阵的生成,从而便于错误分析和模型优化。
摘要由CSDN通过智能技术生成

最近了解了一个令人难以置信的工具,叫做Voxel51的FiftyOne,无法推荐它足够用于你的工作或研究。在文中,将解释如何使用该工具进行图像分类。

介绍

FiftyOne是一个开源工具,为数据集标记和计算机视觉模型分析提供了强大的图形界面。“提高数据质量和了解模型的故障模式是提高模型性能的最有效方法。”[1]拥有一个标准化工具极大地加快和简化了数据和模型质量分析过程。作为一个开放源码项目是最重要的。该工具的官方文档写得很漂亮,可在以下位置获取:

https://voxel51.com/docs/fiftyone/

该工具既可以作为独立应用程序运行,也可以在Jupyter笔记本中运行。

5b4bb62b329e6f4428d378e4153c29c0.png
FiftyOne安装[1]

要安装FiftyOne,可以使用pip。使用以下命令创建名为fo的conda环境,然后使用pip安装FiftyOne库。

[注意:对于M1芯片的MacBooks,你需要手动设置MongoDB后端,因为捆绑的DB安装无法开箱即用。你可以在此处阅读:https://voxel51.com/docs/fiftyone/getting_started/install.html#troubleshooting].

conda create -n fo python=3.8 -y

conda activate fo

pip install fiftyone

如果一切正常,你应该能够在python中加载包。接下来,我们将看两个基本的核心类,共有50个。

FiftyOne数据集和示例[2]

1.数据集:这个类是fiftyone的核心,具有强大的功能来表示数据,并使用python库和fiftyoneUI对其进行操作。你可以加载、修改、可视化和评估数据以及标签(分类、检测等)[2]

即使你有未标记的数据,也可以在FiftyOne应用程序中完成初始探索阶段。它还与CVAT和其他标签平台集成。数据集是Sample类的有序集合,它们被分配了用于检索的唯一ID。

你可以使用以下代码实例化名为“emotion-datase”的空数据集。

import fiftyone as fo

dataset = fo.Dataset("emotion-dataset")

dataset.persistent = True # Use this line if you want your dataset to be persistent and be avialable after system restarts.

2.示例:数据集由存储与任何给定数据示例相关的信息的示例类对象组成。每个示例都有一个文件路径作为必填字段。除此之外,只要数据类型在所有示例中一致,你可以添加任意多个关键字字段。让我们看看下面的一个例子。

sample = fo.Sample(filepath="/path/to/some/image.jpg", ground_truth="class1")

这将创建一个包含filepath和ground_truth字段的示例。请注意,对于整个数据集,ground_truth需要是字符串类名。如果要使用整数,则必须对整个数据集保持一致。

向数据集添加样本非常容易。

dataset.add_samples([sample]) #adds a list of samples to the dataset
方法论

对于本教程,将使用FiftyOne库从Open Images

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值