腾讯AI Lab开源业内最大规模多标签图像数据集（附下载地址）

最新推荐文章于 2025-05-05 14:28:00 发布

AI科技大本营

最新推荐文章于 2025-05-05 14:28:00 发布

阅读量1.8k

点赞数 2

分类专栏： AI 人工智能

本文链接：https://blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/83155473

版权

AI 同时被 2 个专栏收录

546 篇文章

订阅专栏

人工智能

540 篇文章

订阅专栏

今日（10 月 18 日），腾讯AI Lab宣布正式开源“Tencent ML-Images”项目。该项目由多标签图像数据集 ML-Images，以及业内目前同类深度学习模型中精度最高的深度残差网络 ResNet-101 构成。

该开源项目的主要内容包括：

1、ML-Images 数据集的全部图像 URLs,以及相应的类别标注。出于原始图像版权的考虑，此次开源将不直接提供原始图像，用户可利用我们提供的下载代码和 URLs 自行下载图像。

2、ML-Images 数据集的详细介绍，包括图像来源，图像数量，类别数量，类别的语义标签体系，标注方法，以及图像的标注数量等统计量。

3、完整的代码和模型。我们提供的代码涵盖从图像下载，图像预处理，基于 ML-Images 的预训练，基于 ImageNet 的迁移学习，到基于训练所得模型的图像特征提取的完整流程。该项目提供了基于小数据集的训练示例，以方便用户快速体验我们的训练流程。该项目还提供了非常高精度的 ResNet-101 模型（在单标签基准数据集 ImageNet 的验证集上的 top-1 精度为 80.73%）。用户可根据自身需求，随意选用该项目的代码或模型。

以深度神经网络为典型代表的深度学习技术已经在很多领域充分展现出其优异的能力，尤其是计算机视觉领域，包括图像和视频的分类、理解和生成等重要任务。然而，要充分发挥出深度学习的视觉表示能力，必须建立在充足的高质量训练数据、优秀的模型结构和模型训练方法，以及强大的的计算资源等基础能力之上。

腾讯 AI Lab团队将基于 Tencent ML-Images 的 ResNet-101 模型迁移到很多其他视觉任务，包括图像物体检测，图像语义分割，视频物体分割，视频物体跟踪等。

640?wx_fmt=png