腾讯AI Lab正式开源业内最大规模多标签图像数据集

感谢阅读腾讯AI Lab第44篇文章。本文将介绍“Tencent ML-Images”项目正式开源情况。


今日,腾讯AI Lab宣布正式开源“Tencent ML-Images”项目,该项目由多标签图像数据集ML-Images,以及业内目前同类深度学习模型中精度最高的深度残差网络ResNet-101构成。


该项目的开源,是腾讯AI Lab在计算机视觉领域所累积的基础能力的一次释放,为人工智能领域的科研人员和工程师提供了充足的高质量训练数据,及简单易用、性能强大的深度学习模型,促进人工智能行业共同发展。


项目访问地址:

https://github.com/Tencent/tencent-ml-images


腾讯AI Lab此次公布的图像数据集ML-Images,包含了1800万图像和1.1万多种常见物体类别,在业内已公开的多标签图像数据集中规模最大,足以满足一般科研机构及中小企业的使用场景。此外,基于ML-Images训练得到的深度残差网络ResNet-101,具有优异的视觉表示能力和泛化性能,在当前业内同类模型中精度最高,将为包括图像、视频等在内的视觉任务提供强大支撑,并助力图像分类、物体检测、物体跟踪、语义分割等技术水平的提升。


本次正式开源,其主要内容包括:

  1. ML-Images数据集的全部图像URLs,以及相应的类别标注。因原始图像版权问题,此次开源将不直接提供原始图像,用户可利用腾讯AI Lab提供的下载代码和URLs自行下载图像。


  2. ML-Images数据集的详细介绍。包括图像来源、图像数量、类别数量、类别的语义标签体系、标注方法,以及图像的标注数量等统计量。


  3. 完整的代码和模型。腾讯AI Lab提供的代码涵盖从图像下载和图像预处理,到基于ML-Images的预训练和基于ImageNet的迁移学习,再到基于训练所得模型的图像特征提取的完整流程。项目提供了基于小数据集的训练示例,以方便用户快速体验该训练流程。项目还提供了具有极高精度的ResNet-101模型(在单标签基准数据集ImageNet的验证集上的top-1精度为80.73%)。用户可根据自身需求,随意选用该项目的代码或模型。


以深度神经网络为典型代表的深度学习技术已经在很多领域充分展现出其优异的能力,尤其是计算机视觉领域,包括图像和视频的分类、理解和生成等重要任务。然而,要充分发挥出深度学习的视觉表示能力,必须建立在充足的高质量训练数据、优秀的模型结构和模型训练方法,以及强大的的计算资源等基础能力之上。


各大科技公司都非常重视人工智能基础能力的建设,都建立了仅面向其内部的大型图像数据集,例如谷歌的JFT-300M和Facebook的Instagram数据集。但这些数据集及其训练得到的模型都没有公开,对于一般的科研机构和中小企业来说,这些人工智能基础能力有着非常高的门槛。


当前业内公开的最大规模的多标签图像数据集是谷歌公司的Open Images, 包含900万图像和6000多物体类别。腾讯AI Lab此次开源的ML-Images数据集包括1800万图像和1.1万多常见物体类别,或将成为新的行业基准数据集。


此外,基于ML-Images训练得到的ResNet-101模型,具有优异的视觉表示能力和泛化性能。通过迁移学习,该模型在ImageNet验证集上取得了80.73%的top-1分类精度,超过谷歌同类模型(迁移学习模式)的精度,且值得注意的是,ML-Images的规模仅为JFT-300M的约1/17。这充分说明了ML-Images的高质量和训练方法的有效性。详细对比如下表。

640

注:微软ResNet-101模型为非迁移学习模式下训练得到,即1.2M预训练图像为原始数据集ImageNet的图像。


腾讯AI Lab此次开源的“Tencent ML-Images”项目,展现了腾讯在人工智能基础能力建设方面的努力,以及希望通过基础能力的开放促进行业共同发展的愿景。


“Tencent ML-Images”项目的深度学习模型,目前已在腾讯多项业务中发挥重要作用,如“天天快报”的图像质量评价与推荐功能,其后台测试的日调用量已达1000万次。


如下图所示,天天快报新闻封面图像的质量得到明显提高。


640

左图为优化前,右图为优化后


此外,腾讯AI Lab团队还将基于Tencent ML-Images的ResNet-101模型迁移到很多其他视觉任务,包括图像物体检测,图像语义分割,视频物体分割,视频物体跟踪等。这些视觉迁移任务进一步验证了该模型的强大视觉表示能力和优异的泛化性能。“Tencent ML-Images”项目未来还将在更多视觉相关的产品中发挥重要作用。


自2016年腾讯首次在GitHub上发布开源项目(https://github.com/Tencent),目前已累积开源覆盖人工智能、移动开发、小程序等领域的57个项目。为进一步贡献开源社区,腾讯相继加入Hyperledger、LF Networking和开放网络基金会,并成为LF深度学习基金会首要创始成员及Linux基金会白金会员。作为腾讯“开放”战略在技术领域的体现,腾讯开源将继续对内推动技术研发向共享、复用和开源迈进,向外释放腾讯研发实力,为国内外开源社区提供技术支持,注入研发活力。


640
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: 腾讯NLP开源知识图谱是腾讯公司开发的一项自然语言处理技术,通过构建一个庞大的知识图谱,帮助计算机理解和处理人类语言。 知识图谱是一种用于表示真实世界知识的结构化数据模型,它由节点和关系组成。这些节点可以是人、地点、物体、抽象概念等,而关系则表示节点之间的联系。腾讯NLP开源知识图谱通过从各种数据源中收集和抽取信息,并通过机器学习和自然语言处理技术进行处理,构建出一个庞大且精确的知识图谱。 利用腾讯NLP开源知识图谱,可以实现很多应用。例如,在问答系统中,知识图谱可以帮助回答用户的问题。在智能客服中,知识图谱可以帮助机器理解用户的咨询,并提供准确的建议。在搜索引擎中,知识图谱可以提供丰富的相关信息,并帮助用户快速找到所需内容。此外,知识图谱还可以用于文本分析、信息抽取等领域。 腾讯NLP开源知识图谱的开源意味着它可以被广泛应用和改进。开源技术可以吸引更多的开发者加入,共同贡献和改进知识图谱的内容和算法。这样的开放性不仅可以提高知识图谱的准确性和实用性,还可以促进整个行业的发展和创新。 总之,腾讯NLP开源知识图谱是一个强大的自然语言处理工具,通过构建庞大的知识图谱,提供了丰富的信息和功能,并且由于其开源的特性,可以与更多应用和技术相结合,为广大用户和开发者带来更多便利和创新。 ### 回答2: 腾讯NLP开源知识图谱是腾讯公司在自然语言处理领域所开源的一个项目。知识图谱是一种结构化的数据模型,用于表示现实世界中的实体与它们之间的关系。腾讯NLP开源知识图谱的目的是通过构建和共享一套通用的知识表示方式,促进自然语言处理领域的研究和应用。 腾讯NLP开源知识图谱项目的核心是知识图谱的构建和维护。该项目囊括了大量经过结构化处理的知识,包括实体、属性和关系等。这些知识来自于多种不同的数据源,如百科全书、社交媒体等。通过将这些知识整合到一个统一的知识图谱中,可以更好地驱动自然语言处理任务的执行,例如文本表示、实体识别、关系抽取等。 腾讯NLP开源知识图谱的优势在于其广泛的适用性和高质量的知识表达。该项目致力于通过开源方式推进自然语言处理的研究,使研究人员和开发者能够更好地利用和扩展该知识图谱。此外,腾讯公司还提供了相应的工具和API,以便更方便地使用知识图谱进行开发和应用。 总之,腾讯NLP开源知识图谱是腾讯公司在自然语言处理领域开源的一个重要项目,它为研究人员和开发者提供了一个丰富的知识资源和相应的工具支持,有助于推动自然语言处理技术的发展和应用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值