作者|魔王、张倩
来源|机器之心
上海交大研究人员创建新型开放医疗图像数据集 MedMNIST,并设计「MedMNIST 分类十项全能」,旨在促进 AutoML 算法在医疗图像分析领域的研究。 在 AI 技术的发展中,数据集发挥了重要的作用。然而,医疗数据集的创建面临着很多难题,如数据获取、数据标注等。 近期,上海交通大学的研究人员创建了医疗图像数据集 MedMNIST,共 包含 10 个预处理开放医疗图像数据集(其数据来自多个不同的数据源,并经过预处理)。 项目地址: https://medmnist.github.io/ 论文地址: https://arxiv.org/pdf/2010.14925v1.pdf GitHub 地址: https://github.com/MedMNIST/MedMNIST 数据集下载地址: https://www.dropbox.com/sh/upxrsyb5v8jxbso/AADOV0_6pC9Tb3cIACro1uUPa?dl=0 和 MNIST 数据集一样,MedMNIST 数据集 在轻量级 28 × 28 图像上执行分类任务,所含任务覆盖主要的医疗图像模态和多样化的数据规模。根据研究人员的设计,MedMNIST 数据集具备以下特性:教育性:该数据集中的多模态数据来自多个具备知识共享许可证的开放医疗图像数据集,可以用作教育目的。
标准化:研究人员对数据进行预处理,将其转化为相同的格式,因此用户无需具备背景知识即可使用。
多样性:多模态数据集涵盖多种数