华为云ModelArts肺部X射线图片识别肺炎模型训练

殇银

于 2022-06-02 18:18:14 发布

阅读量583

点赞数

分类专栏：华为云文章标签：华为云

本文链接：https://blog.csdn.net/zx6571/article/details/125105136

版权

华为云专栏收录该内容

1 篇文章 0 订阅

订阅专栏

ModelArts是面向AI开发者的一站式开发平台，提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成，及端-边-云模型按需部署能力，帮助用户快速创建和部署模型，管理全周期AI工作流。楼主本次就是在ModelArts平台上实现对肺部X射线图片的识别分类工作。

本次工作的数据集为ModelWhale网站上的X射线肺炎图像数据集来作为训练数据，该份数据是从广州市妇幼保健院1～5岁儿童患者的回顾性队列中选择胸片(前后)。所有胸部x光片影像均作为患者常规临床护理的一部分。对于x线胸片的分析，所有的胸片都进行了初步筛选，剔除所有低质量或不可读的扫描，以进行质量控制。同时该数据集已经被组织成3个文件夹(train, test, val)，并包含每个图像类别(肺炎/正常)的子文件夹。共有5863张x线图像(JPEG)和2类(肺炎/正常)。因此数据集的选择有相关专业医生的把握，质量较高，并且数据量也较多，用于实际的训练时效果会比较好。具体的数据集图片如下所示：

图1 部分数据集训练集肺炎患者X射线图

图2 部分数据集测试集无肺炎患者X射线图

之后创建一个华为云账号并登录，首先进入对象存储服务OBS服务台，OBS服务是华为云推出的稳定、安全、高效、易用的云存储服务，具备标准Restful API接口，可存储任意数量和形式的非结构化数据。

在其中购买合适的资源包后创建两个OBS桶，一个桶作为数据的输入，一个桶作为数据的输出结果，名字可以任意，之后在桶中创建两个文件夹，分别上传肺炎患者的肺部X射线图以及正常人的肺部X射线图。具体结果图如下所示：

图3 OBS桶内文件夹对象图

然后进入ModelArts平台，进入后点击左侧“自动学习”按钮进入操作界面，选择“图像分类”创建项目，输入项目名称与数据集名称，并确定数据集输入位置与输出位置即可。项目创建完成后首先需要进行数据的标注，即给输入的图片打上标签来让神经网络知道哪个数据对应哪一类，在本次设计中我将数据分为了none与pneumonia两类，来区分有无患上肺炎。具体结果图如下所示：

图4 数据标注图

标注完成后便可进行模型的训练，设定设定超参数，训练时长和推理时长，然后点击右下角“开始训练”按钮开始分类模型的训练。训练时我使用了默认的参数，并未进行修改。结果图如下所示：

图5 训练结果图

训练完成后我选择进行模型的部署，通过输入其他的图片来判断训练好的模型效果。部署结果图如下所示：

图6 部署结果图

小结：

通过使用华为云上的ModelArts平台，我实现了对肺部X射线图像的分类工作，并且取得了较好的效果。但是本次模型训练楼主认为依旧有一定的不足之处：

数据集来自于1-5岁幼儿的肺部X射线图，如果实际针对全年龄段肺部X射线图的识别可能准确率不会很高，后续应该从网上查找或与相关医院进行合作，选取更多各年龄段的肺部X射线图进行模型的训练。
查询相关资料可知，医学影像的特征不同于普通图像,难以进行特征的抓取。在肺部计算机断层图像中,除了肺部组织之外,还包括肌肉、骨骼等多种组织,让机器学习包含这些组织的原始图像时,容易造成模型的关注点转移到这些组织上,从而导致识别的准确率难以提升。

希望能够给各位使用华为云ModelArts时有所帮助，如有错误还请指出。(＾－＾)