深度学习开源图片数据库汇总

数据的准备工作是训练模型前的必要工作,显然这也是非常耗时的,所以在入门阶段我们完全可以用现有的开源图片库快速完成前期的准备工作:

ImageNet

  ImageNet是根据WordNet层次结构(目前只有名词)组织的图像数据库,其中层次结构的每个节点都由数百和数千个图像描绘。 目前,数据库中每个节点平均拥有超过五百幅图像。 我们希望ImageNet将成为研究人员,教育工作者,学生以及分享我们对图片热情的所有人的有用资源。
  ImageNet的一些特点:
  ImageNet是全球最大的开源图片库,截至到现在(2017.5)ImageNet共有一千四百多万张图片。其中包括超过20000个synset(s),synset是近义词的合集,synsnet可以理解为ImageNet整理的标签。
  说到WordNet层次结构,就要提一下什么是WordNet,WordNet是普林斯顿大学开源的词汇库,可以理解为是一个词典。每个词语(word)可能有多个不同的语义,对应不同的sense。而每个不同的语义(sense)又可能对应多个词,如topic和subject在某些情况下是同义的,WordNet由Princeton 大学的心理学家,语言学家和计算机工程师联合设计的一种基于认知语言学的英语词典。它不是光把单词以字母顺序排列,而且按照单词的意义组成一个“单词的网络”。WordNet 主要有3个主概念 Synset, WordSense 和 Word。而ImageNet就是应用了synset这个概念,只是ImageNet目前只有名词。
  由于图片的版权问题,ImageNet中的图片以URLs的形式提供下载,也就是说ImageNet只提供这个图片在哪,而不直接提供图片本身。
这里写图片描述
  我们在ImageNet搜索一个synset的时,左侧可以看到他的层次结构WordNet,在Download中提供了URLs的下载地址。

CIFAR

  CIFAR由Alex Krizhevsky, Vinod Nair和 Geoffrey Hinton收集并整理,在Visual Dictionary的80万张图片中选择了6万张,并把它们分为CIFAR-10 和CIFAR-100。
  CIFAR-10数据集包含60000个32*32的彩色图像,共有10类。有50000个训练图像和10000个测试图像。数据集分为5个训练块和1个测试块,每个块有10000个图像。测试块包含从每类随机选择的1000个图像。训练块以随机的顺序包含这些图像,但一些训练块可能比其它类包含更多的图像。训练块每类包含5000个图像。
  CIFAR-100数据集包含100小类,每小类包含600个图像,其中有500个训练图像和100个测试图像。100类被分组为20个大类。
这里写图片描述

MNIST

  MNIST深度学习领域中大名鼎鼎的数据集—MNIST,几乎所有的深度学习教程的入门实例都是手写数字识别,而它们用到的库就是MNIST。这就好比我们学习一门语言的时候显示"hello world"。
  MNIST数据集共包含7万个样本,分别是手写体数字0~9,样本大小为28*28。

这里写图片描述

Labeled Faces in the Wild##

  Labeled Faces in the Wild数据库中收集了1万3千多张人脸图像,共包含了5000多个人物。每个人标记除了人物的名字外,还包含了其他信息,比如性别,年龄等

这里写图片描述

Quick Draw

  Quick Draw是由google发布的涂鸦数据集,其中包含 5000 万张图画的集合,分成了 345 个类别,它其实就是张这个样子:
这里写图片描述

  这么看起来这个数据集还是挺无聊的,它的发布其实是源于谷歌推出的 AutoDraw ,这是一个能把你的随手涂鸦变成绘画的人工智能技术工具,就是这样(谷歌总是在做一些很好玩的东西):
这里写图片描述

  谷歌也曾发布论文和博客介绍了其背后的技术。实际上,AutoDraw 所用的技术基于谷歌先前的涂鸦实验「Quick, Draw!」。近日,谷歌发布了该项目背后的数据集,就是之前提到的Quick Draw数据集了。这个项目同时发布到了git上,在git的地址中对数据集进行了详细的介绍,在这里简要描述下:

  原始数据在 ndjson 文件中,并按类别进行了分割,按照如下格式:
这里写图片描述

  该数据集在谷歌云存储服务中,在 ndjson 文件中分类存储。请参阅 Cloud Console 中的文件列表,数据集分类如下:

Raw files (.ndjson)
Simplified drawings files (.ndjson)
Binary files (.bin)
Numpy bitmap files (.npy)

  其中原始文件和简笔画都是.ndjson形式存储,同时提供了二进制文件(.bin)和Numpy 位图(.npy)文件。

Binary files (.bin)
  我们也提供了简化后的绘画和元数据的定制二进制格式,可用于高效的压缩和加载。examples/binary_file_parser.py 给出了如何用 Python 加载该文件的示例。

Numpy 位图(.npy)
  所有简化过的绘画也都被转换成了 28×28 的灰度位图,保存为 numpy 的 .npy 格式。该文件可以通过 np.load() 函数加载。

AI-Challneger

  AI-Challneger是一个由创新工场发起的大赛,其中有6个项目,每一个项目下都提供了配套的数据集,比如场景分类项目下,到目前为止提供了三个数据集,分别是训练集(train),验证集(valuation)和测试集A(test_a),分别包含图片5w+,7k+,7k+;包含80类场景图,支持直接下载原图。
这里写图片描述

kaggle cats vs. dogs

  猫狗大战数据集,大名鼎鼎的kaggle大赛下的数据,一个二分类数据集,训练集中猫狗图片各12500张,测试集中猫狗图片共12500张,支持原图下载。
这里写图片描述

notMNIST

  notMNIST数据集起做这个名字是为了致敬MNIST,它提供了从A到J是个字母的图片,图片大小为28*28,而且图片不是手写字母,而是来源于网络上各种各样奇奇怪怪的图片,比如字母A:
这里写图片描述
  该数据集提供了两个版本,其中large版中,每个类大概5.3W左右的图片,总数在53W个,类别间数据比较平均。

Pascal VOC

  PASCAL VOC挑战赛是视觉对象的分类识别和检测的一个基准测试,提供了检测算法和学习性能的标准图像注释数据集和标准的评估系统。PASCAL VOC图片集包括20个目录:人类;动物(鸟、猫、牛、狗、马、羊);交通工具(飞机、自行车、船、公共汽车、小轿车、摩托车、火车);室内(瓶子、椅子、餐桌、盆栽植物、沙发、电视)。PASCAL VOC挑战赛在2012年后便不再举办,但其数据集图像质量好,标注完备,非常适合用来测试算法性能。

这里写图片描述

##COCO common objects Dataset##
  COCO数据集由微软赞助,其对于图像的标注信息不仅有类别、位置信息,还有对图像的语义文本描述,COCO数据集的开源使得近两三年来图像分割语义理解取得了巨大的进展,也几乎成为了图像语义理解算法性能评价的“标准”数据集。Google的开源show and tell生成模型就是在此数据集上测试的。
目前包含的比赛项目有:
1.目标检测(COCO Detection Challenge),包含两项比赛:
  输出目标物的边框即可(using bounding box output),也就是我们常说的目标检测(object detection)了
要求把目标物从图像中分割出来(object segmentation output),即我们所说的图像语义分割(Semantic image segmentation)
2.图像标注(COCO Captioning Challenge)
  具体说来就是一句话准确描述图片上的信息(producing image captions that are informative and accurate)。那这个怎么评分呢?目前是靠人工评分。
3.人体关键点检测(COCO Keypoint Challenge)
  比赛要求是找到人在哪,然后定位到人体的一些关键点位置(The keypoint challenge involves simultaneously detecting people and localizing their keypoints)。
这里写图片描述

##CityScapes##
  CityScapes数据场景包括50个不同城市(主要在德国),春夏秋三个季节白天的场景,有大量的动态目标不同层次的场景和多样的背景。场景不包括下大雨的和下雪的,因为这种场景需要用特殊的技术处理。
  图像数据分为30类:除了有 5000帧细标注的(像素级别的),标注一张图时间控制在1.5h左右,精细标注的数据划分成如下图训练验证测试集,不是随机划分的,而是确保每个划分的数据集里面包含各种场景。最终有2975张用来训练,500张用来验证,1525张用来测试。此外,还有20000张弱标注的帧,只用来训练,标注一张图控制在7min内。
这里写图片描述

持续更新中…

  • 18
    点赞
  • 86
    收藏
    觉得还不错? 一键收藏
  • 7
    评论
2021 AI基础软件架构峰会PPT汇总,共29份。 AI基础设施软件技术横跨深度学习算法、编程语言、编译器、数据库、分布式系统、高性能网络和AI芯片等多个前沿领域,是当前学术界和产业界共同感到兴奋的新领域。 一、AI芯片及编译器 AI芯片软件栈技术挑战和初探 地平线在软硬件协同设计的一些实践 NVIDIA GPU架构下稀疏特性的实践与挑战 二、深度学习框架 当我们谈论框架时,我们在谈论什么? 面向云计算的分布式机器学习优化实践 超大模型高效训练的分布式框架Whale 飞桨:源于产业实践的开源深度学习平台 MegEngine DTR 技术与训练框架技术创新 构建高效易用的图深度学习平台 三、端侧推理 Tengine-边缘AI异构计算平台 面向AIoT的深度学习框架MACE PNNX:PyTorch Neural Network Exchange MNN —— 功能完备的推理引擎 四、MLops及AI工程化落地 建立公开数据集标准,赋能AI工程化落地 字节跳动机器学习系统云原生落地与实践 OpenMLDB:为AI工程化落地高效供给正确数据 开源AI框架的程序接口设计 五、超大规模模型训练 快手八卦!突破 PyTorch、TensorFlow并行瓶颈的训练加速框架到底是啥? Maximizing Parallelism in Distributed Training for Huge Neural Networks 神舟大规模预训练模型 让大规模分布式深度学习变得更方便 六、互联网广告推荐 基于GPU的超大规模离散模型训练框架PaddleBox、FeaBox 浅谈点击率预测模型中Embedding层的学习和训练 XDL训练系统的演进 稀疏模型训练引擎-DeepRec 无量深度学习系统在腾讯推荐类业务的应用 七、前沿应用与基础架构 如何使用 JuiceFS 为 CV 模型训练提速 Milvus+Towhee:向量数据库及embedding流水线
2020人工智能与机器学习创新峰会PPT汇总,24个专题共73份资料。供大家学习参考。 一、测试新趋势 业务数据监控从0-1脱敏 AI在游戏数值与平衡性分析中的应用 微众研发效能改进之数据度量体系 敏捷测试团队转型实践 二、大规模机器学习算法 快速深度学习训练优化算法 三、高效运维 构建全链路数据度量体系、实现DevOps数据驱动闭环 既快又好 DevOps为小红书全员质量保障赋能 浙江移动AIOpsDev运维转型实践-脱敏版 四、工业4.0 AI赋能医药工业发展案例 五、机器学习框架 Volcano加速AI云原生迁移之路 基于分布式机器学习的通信网络资源协同优化和分配 如何做智能边缘计算 六、计算机视觉 深度学习Depth预测--在2d-to-3d项目中的应用 PaddleOCR产业实践之路:如何打造8.6M超轻量模型,一条龙解决训练部署问题 视觉问答与对话系统的新技术进展 视觉技术赋能高效淘宝素材质量巡检 七、架构演进 边缘计算的缘起、价值和实践 AI人脸识别应用技术方案选型与架构落地 爱奇艺 K8S GPU 共享虚拟化实践和优化 菜鸟运力平台架构演进 八、流式计算 美团点评实时计算平台 小米实时计算平台构建 超大规模 Flink 调度优化实践 九、落地"大中台"战略 有赞数据中台降本治理 演进式的大规模业务中台体系落地实践 京东B2B中台化实践A2M 十、企业级大数据架构演进 基于阿里云数据湖分析服务DLA快速构建数据湖解决方案 Delta Lake在实时数仓中的应用实践 滴滴数据平台建设实践 美图PB级大数据基础架构升级之路 十一、区块链 新基建下可信区块链网络建设 基于区块链的药品溯源体系建设 区块链+电子合同 确保效力 放飞效率 千里之堤溃于蚁穴 十二、数据库的未来 PB级结构化日志数据的高效处理 TBase多中心多活应用实践 使用 TiDB 列存引擎进行实时数据分析 十三、图神经网络、知识图谱 知识图谱在内容安全中的实践应用 百度事件图谱技术与应用 华为云知识图谱平台技术及案例分享 知识图谱在腾讯AI医疗的应用实践-脱敏版 十四、推荐系统 多模态内容理解在推荐系统的应用 小红书推荐系统的架构演进 知乎搜索排序模型实践 十五、微服务的2.0时代 如何优雅的步入微服务2.0时代(脱敏版) 微服务之后,分层架构该如何演进 微服务网关(2) 十六、云原生构建之路 从0到1构建云原生智能金融电商-脱敏版 Tars与k8s如何结合,助力阅文海外业务 云原生应用性能优化之道 Dubbo 基于 MOSN 在 Service Mesh 场景下的落地实践-曹春晖 十七、智慧金融 智慧金融的新基础设施-数据中台-A2M 自然语言处理在金融实时事件监测和财务快讯生成中的应用 联邦学习在金融安全领域的研究与应用 人工智能Fairness在金融行业的研究:基于Pipeline的方法 十八、智能数据分析 闲鱼纳米镜--人人都是数据分析师 大数据分析系统在游戏领域的实践 十九、智能语音 智能语音交互 面向自然交互的多模态人机交互解决方案 二十、AI基础设施建设 飞桨开源模型库与行业应用 基于飞桨的深度学习全流程开发实战 NLP定制化训练实践1.3 二十一、AIOps AItest 百度AIOps解决方案及行业落地案例--脱敏 邱化峰-使用AI从业务测试走向业务验证 面向人工智能的测试体系建设 - 脱敏 二十二、FinTech 恒生银行DevOps实践和探索 数字化转型:从内部一体走向内外一体 基于区块链的隐私支付分析与比较 二十三、IOT 数字化转型升级 AIoT在工业水处理中的应用和实践及对永续发展的意义 二十四、NLP 阿里小蜜DeepQA算法平台化大规模提效实践 多模态内容生成在京东商品营销中的探索与实践
### 回答1: 深度学习ck数据库是一个用于存储和管理深度学习模型权重参数的数据库深度学习是一种基于神经网络的机器学习方法,具有较强的模型复杂性和表达能力,可以在图像、语音、文本等多个领域实现非常优秀的表现。 由于深度学习模型通常包含大量的权重参数,这些参数的存储和管理对模型的训练和应用都是至关重要的。深度学习ck数据库提供了一个统一的存储和管理框架,使得研究者和开发者可以更方便地访问和共享模型权重参数。 深度学习ck数据库的设计考虑了可扩展性和高效性。它可以容纳大规模的模型权重参数,并且可以支持快速的读写操作。另外,深度学习ck数据库还提供了各种方便的接口和工具,帮助用户进行模型的加载、保存、查询等操作。 在实际应用中,深度学习ck数据库扮演了重要的角色。它可以为学术界和工业界的研究人员提供一个共享和对比模型的平台,促进深度学习的发展。此外,深度学习ck数据库还可以用于模型的迁移学习,提供一个预训练好的模型作为初始权重参数,加速模型的收敛和优化过程。 总之,深度学习ck数据库是一个重要的深度学习工具,为存储和管理模型权重参数提供了统一的框架和方便的接口。它在促进深度学习研究和应用方面发挥了重要的作用。 ### 回答2: 深度学习是一种机器学习的方法,通过模拟人脑神经网络的结构和功能,对大规模的数据进行分析和学习,从而能够自主地发现并学习其中的模式和规律。 CK数据库(Collective Knowledge)是一个开源的、社区驱动的、面向复杂数据和机器学习任务的共享平台。它的目标是帮助组织和研究者共享他们的实验数据、方法和结果,从而促进学术和工业界之间的合作和创新。 在深度学习领域,许多研究人员和机构面临着一个共同的问题,那就是重复性实验和结果的共享和复现。CK数据库提供了一个集中式的平台,让研究人员可以轻松地记录和共享他们的实验设计、数据集、模型和结果。这大大简化了实验的重复性和验证的过程,同时也提供了一个方便的知识库,让其他研究人员可以借鉴和学习。 CK数据库还具有自动化的特性,它可以为用户提供模型自动优化、算法选择和资源调度等功能。通过使用CK数据库,用户可以更加高效地进行深度学习实验,并且获得更好的结果。 总之,深度学习依靠大规模数据和复杂的神经网络结构进行模式识别和学习。而CK数据库则帮助研究人员在这个领域更好地共享数据和实验结果,加速研究进展,促进合作和创新。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值