华为云ModelArts肺部X射线图片识别肺炎模型训练

        ModelArts是面向AI开发者的一站式开发平台,提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成,及端-边-云模型按需部署能力,帮助用户快速创建和部署模型,管理全周期AI工作流。楼主本次就是在ModelArts平台上实现对肺部X射线图片的识别分类工作。

        本次工作的数据集为ModelWhale网站上的X射线肺炎图像数据集来作为训练数据,该份数据是从广州市妇幼保健院1~5岁儿童患者的回顾性队列中选择胸片(前后)。所有胸部x光片影像均作为患者常规临床护理的一部分。对于x线胸片的分析,所有的胸片都进行了初步筛选,剔除所有低质量或不可读的扫描,以进行质量控制。同时该数据集已经被组织成3个文件夹(train, test, val),并包含每个图像类别(肺炎/正常)的子文件夹。共有5863张x线图像(JPEG)和2类(肺炎/正常)。因此数据集的选择有相关专业医生的把握,质量较高,并且数据量也较多,用于实际的训练时效果会比较好。具体的数据集图片如下所示:

图1  部分数据集训练集肺炎患者X射线图

图2 部分数据集测试集无肺炎患者X射线图

       之后创建一个华为云账号并登录,首先进入对象存储服务OBS服务台,OBS服务是华为云推出的稳定、安全、高效、易用的云存储服务,具备标准Restful API接口,可存储任意数量和形式的非结构化数据。

       在其中购买合适的资源包后创建两个OBS桶,一个桶作为数据的输入,一个桶作为数据的输出结果,名字可以任意,之后在桶中创建两个文件夹,分别上传肺炎患者的肺部X射线图以及正常人的肺部X射线图。具体结果图如下所示:

 图3 OBS桶内文件夹对象图

        然后进入ModelArts平台,进入后点击左侧“自动学习”按钮进入操作界面,选择“图像分类”创建项目,输入项目名称与数据集名称,并确定数据集输入位置与输出位置即可。项目创建完成后首先需要进行数据的标注,即给输入的图片打上标签来让神经网络知道哪个数据对应哪一类,在本次设计中我将数据分为了none与pneumonia两类,来区分有无患上肺炎。具体结果图如下所示:

 图4 数据标注图

        标注完成后便可进行模型的训练,设定设定超参数,训练时长和推理时长,然后点击右下角“开始训练”按钮开始分类模型的训练。训练时我使用了默认的参数,并未进行修改。结果图如下所示:

图5 训练结果图 

         训练完成后我选择进行模型的部署,通过输入其他的图片来判断训练好的模型效果。部署结果图如下所示: 

图6 部署结果图

小结:

       通过使用华为云上的ModelArts平台,我实现了对肺部X射线图像的分类工作,并且取得了较好的效果。但是本次模型训练楼主认为依旧有一定的不足之处:

  1. 数据集来自于1-5岁幼儿的肺部X射线图,如果实际针对全年龄段肺部X射线图的识别可能准确率不会很高,后续应该从网上查找或与相关医院进行合作,选取更多各年龄段的肺部X射线图进行模型的训练。
  2. 查询相关资料可知,医学影像的特征不同于普通图像,难以进行特征的抓取。在肺部计算机断层图像中,除了肺部组织之外,还包括肌肉、骨骼等多种组织,让机器学习包含这些组织的原始图像时,容易造成模型的关注点转移到这些组织上,从而导致识别的准确率难以提升。

        希望能够给各位使用华为云ModelArts时有所帮助,如有错误还请指出。(^-^)

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值