如何从零开始培养一名“放射科医生”?

559 篇文章 5 订阅
69 篇文章 1 订阅

全文共2638字,预计学习时长5分钟

图片来源:https://www.pexels.com/@linkedin

计算机学习检测 (尽管位置错误)

一个毫无放射学经验的人怎么才能教机器看x光片呢?事实上,我们可以创造出一台善于发现缺陷的机器,其能力堪比放射科医生。

哪张x光片显示异常体征?

目前,有团队正在研制一种机器,它可以对x线扫描是否患有气胸(即肺部塌陷)的x光片进行分类,然后识别图像中塌陷区域。除了分辨出不同,还必须想办法来显示图像中的不同区域。虽然图像上可能显示标签,但机器没有标记哪个区域是气胸。

这无异于让盲人教机器如何“观察”图像并通过看图确定气胸是否呈现阳性体征。最重要的是,能借助的工具是在两个截然不同的编码框架中运行,这让人感觉像是在用两种不同的方言交谈。能奇迹般地克服这种情况并将所构建的系统与可能用于拯救人类生命的系统结合起来。简直不可思议。

严峻考验

该问题分为两部分:分类和分割。分类器的任务是根据标签分类图像(如x光片是否显示患有气胸症状,即气胸呈阳性或阴性),而分割的任务是通过将图像分割为“几部分”来识别图像有问题的部分(例如,如果呈阳性,那么机器会将阳性区域将图像标出边界以此来区别于其它部分)。本文将主要介绍分类工作。

因为是在不同的框架中编码,所以必须创建个人分类器。在这个三人的研究团队中,要比较各自的分类器,并选择其中最准确的一个。其中一位参与者的工作是对x光片进行预处理。

作为替代,该团队仅使用了基于Pytorch的fastai。fastai是一个适合初学者的库,其简化了加载图像数据集的整个过程,人们可在深度学习模型上对其进行训练,然后使用它来预测新图像的标签。关于该库还有一个完整的在线课程,研究团队根据其中第一节课制作了其第一个图像分类器。

因此,由于没有其他人询问如何在Pytorch中实现此功能,所以只是重复了第一个项目的步骤。他们获得了医学影像信息学学会(SIIM)提供的图像数据集,并与新加坡国家超级计算中心(NSCC)的GPU进行远程连接。利用Python Excel操作知识来清理标签文件。

使用这个数据集在Resnet-50上训练模型。Resnet-50是一个模型/神经网络,程序员之前输入了数百万张图像,生成一系列“权重”。把权重想象成一组数字,这些数字则代表了模型中神经元之间的强度,帮助模型“观察”图像。直观的感觉是,使用Resnet-50的权重比使用随机选择的权重要好,因为模型在“观察”图像方面已经做得更好了。这个过程叫做迁移学习。另一个比方是,这就像老师(预训练模型)将知识传递给学生(针对特定问题的新模型)。

同一幅图像有4种不同的尺寸。由于高质量的图像更为清晰,有助于计算机“观察”图像,所以可从分辨率最高的1024 x 1024像素图像开始。这个过程花了一个半小时。

Fit one cycle policy 是一种加速学习的技术,但是要处理1024×1024的图像仍然需要2个小时

真实地把大约44,000张高清图像输入了电脑。但令人惊讶的是,在默认设置下,准确率为86%。由于GPU经常耗尽内存,最终不得不放弃这种方法。

只要6MB就能远程摧毁一个外国政府的硬件

机器自学

令人惊讶的是,在一开始就达到了86%的准确率。这超出了预期,比很多程序员看x光片的能力好多了。但它是如何做到的呢?这里并没有给出任何解释,只是说了哪些图片显示阳性,哪些不是,但它能够在没有标签的验证集上预测。机器是怎么学习如何学习的呢?

根据经验和观察不断概括总结是学习的基本特征,机器在这方面做得越来越好。

看看这个模型是怎么来的。机器“学习”的基本原理是不断输入示例供其进行总结学习。从示例中,它能够找到一种模式,就像人类回忆过去一样。这不是死记硬背,因为它能够进行概括并应用于不可见的新数据。他们没有编写代码明确地告诉它如何实现。它自己制定了一个规则。根据经验和观察不断概括总结是学习的基本特征,机器在这方面做得越来越好。那么,怎么在没有放射学经验的情况下,教一台机器如何观察呢?

接下来使用较小的图像,512 X 512的图像。与前一次相比,其速度之快令人惊讶:

模型几乎达到了同样的精度,且速度比之前快了十倍。真了不起。

但事实并非如此。与前一个版本相比,它可以在同一个样本训练周期更好地进行分类,且分辨率几乎只有前一个版本的一半。直觉错了。也许模型不需要考虑那些使分辨率更高的不必要的细节。若再做一次,或许可以得到更高的初始准确度。团队花了最后几个小时调整模型加以改进。

模型的最终版本。得到了89%的准确率但是却不能保存这个版本。

最后,这一分类器准确率最高(紧随其后的准确率为约71%),并结合分割模型完成了气胸检测器。这个模型既不是建立在复杂的预处理技术之上,也不是建立在优雅的算法之上。仅仅遵循一些简单的技术,就能够建立一个表现出色且准确度高的模型,着实令人惊讶。该模型仍有很多方面亟待改进。

加权梯度类激活映射( Grad-CAM ):模型“观察”的位置。(中)区域越热,模型对该区域的聚焦越高。注意:机器能忽略旁边的标签和箭头。放射科医生已证实气胸在发热区。(右)灰度图像。

目前随着人工智能不断改变着人们的工作方式,正规训练和气胸问题的存在反映出人工智能应用的总体状况。在此阶段,人工智能系统还有许多尚未开发的领域,人们正在挖掘其提高生活质量的潜力。单看气胸问题,就会有人尝试着开发出一种不需要放射科医生参与的解决方案,就像自动驾驶汽车不需要司机一样。这在缺乏放射科医生的地方应用广泛。同样可将此技术应用到人力不足的特定工作领域。

然而,这又一次牵扯出许多问题,如劳动力减少、失业工人缺乏再培训、使用人工智能做出不道德的判断,以及使用人工智能系统针对那些长期存在社会和资本不平等的被剥夺权利的群体。有一天,普通人也许被迫以类似于处理贫困和政治问题的方式来应付人工智能带来的种种问题。互联网重塑了大多数人与现实世界互动的方式,人工智能主宰人类的生活,可能也只是时间问题。

这种情况说明课堂远不足以让人了解这个世界。仅仅有理论是远远不够的,只要现实世界的变化伴随着独特的、隐藏的问题,其发生的速度快于课堂教学的变化,课堂教学必是望尘莫及。

你可以像这个团队中的人一样拥有足够优秀的背景,但也只能在某些领域具有优势。从收集信息到训练模型,再到可视化,仅凭一个人之力很难完成这些步骤,往往需要领域内的专业人士的协助。

留言 点赞 关注

我们一起分享AI学习与发展的干货
欢迎关注全平台AI垂类自媒体 “读芯术”

(添加小编微信:dxsxbb,加入读者圈,一起讨论最新鲜的人工智能科技哦~)

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值