人工智能进入了瓶颈期?

标题 人工智能进入了瓶颈期?

在搞AI医疗的工作过程中遇到一些问题,进行了思考,这也是很多人工智能厂商面临的问题。
现在的人工智能主要以深度神经网络为主,这是一种靠数据驱动的神经网络:模型可能相同,但是输入的数据不同,则训练出来的神经网络不同;以监督学习为主,需要大量的标签数据,没有高质量的数据AI就变成了无源之水。据说一些人工智能厂商的数据获取成本占据整个公司成本的30%左右。有一句笑话:“人工智能”已经变成了“智能人工”。就是说虽然号称人工智能,却还是需要靠智能的人类去标注数据,去教会AI学习。
拿医疗领域来说,数据获取的成本非常高。因为涉及隐私性和国家法律的保护,加上现在国内的医院之间数据没打通,形成很多信息孤岛,相对比较封闭,所以获取医疗数据难度很大,一般AI厂商都是以科研合作的方式获取数据。即使能获取到医疗数据,还需要有经验的医生标注数据,其实就是让医生教会神经网络如何去识别。这个工作量也不少,占据医生大量时间。而发展相对成熟的AI医学影像辅助诊断系统,都是数据集相对充分的病种,例如肺结节检测&分类。所以现在的AI对数据依赖非常大,如何能在较小训练数据情况下,在保持高精确度的前提下,让神经网络正常工作,是当AI行业面临的重大问题。

具体到医疗行业,以肺结节举例,结节分正常和恶性的,恶性的就可能发展为肺肿瘤。可以想象一下,在指南或者老师指导下,给医生一些CT肺结节的影像,教了几轮后,医生就很容易识别出正常和异常结节。正常结节一般周边光滑,而肿瘤却周边轮廓不清晰,具有沁润性,像树木根部那样具有向周围扩张的分叉特性。人类很容易总结出这些规律(当然对于一些复杂的结节,也需要经验丰富的影像科医生去识别)。但是深度神经网络却需要大量的数据去教训练,不具备总结规律的能力,显得比较笨。

深度神经网络发展到现在,好像遇到了瓶颈期,最近几年很少有理论方面的重大突破,而能发明一种新型网络结构就很不错了。现在更多的AI论文是关于网络模型的微改以及调参。所以有人说,神经网络不是一门科学,而是一门艺术。需要花费大量时间去调参,而调参又没有统一的标准,并且还需要靠数据驱动。

当然说到深度神经网络遇到瓶颈,并没有否定起重要作用。深度神经网络是人类科技发展史上一次重大进步:输入数据,通过误差反馈来调整成千上万个权重和偏移,让网络来适应数据,识别数据,进行分类。只要有大量的数据训练,AI几乎是能进行万能的回归、分类、分割和识别。深度神经网络模拟了人类神经元进行经验学习的结构,但是还没达到人类更高思维阶段。人类如何进行高级思维,需要更多研究才能揭示。我相信如果能科学学术界能搞清楚人类更高的思维方式,例如归纳总结、推演和直觉等,那么必然会推动人工智能上一个台阶。

对于现在AI存在的问题,我和在机器视觉方面的专家金博士讨论过,他也发现这个问题。他提出,应该是两轮驱动:数据驱动和知识驱动。所谓知识驱动就是特征模式识别,根据知识库去区分。例如如果能总结出恶性肿瘤的特征,具有分叉沁润性,边缘不圆滑。这样不需要提供大量的训练数据,就能进行识别。但是这里也存在一个问题,就是恶性肿瘤可能形状千奇百怪,特征描述能否完全归纳覆盖?

另外金博士也发现一个现象,他说在质量检测行业,一个手机屏幕如果出现裂纹,一个几乎没任何先验知识的懵懵懂懂的五岁小孩也能发现问题,认为这是一部有问题的手机,这个小孩并没有经过大量经验的训练。在一次研讨会上他们几个专家也讨论过这个问题,感觉很神奇。所以如何能模拟出人类的思维,人工智能还需要很长的路要走。

在不牺牲精度和误差率的前提下,如何大大降低训练数据数量,不仅仅是一个技术问题,也是一个商业问题,因为这样能大大降低公司的运营成本。

对此我分析了一些原因,提出一些解决的思路。首先个人认为现在的深度学习网络,例如图像方面的卷积神经网络,虽然有不同的感受视野,但是却只是在同一张图内部进行连接共享,图之间并没有进行关联处理,这样就无法发现不同图像之间的差别。我的思路是,如果用肿瘤图像减去正常结节图像,得到他们之间的差,然后把这个差也输入训练,那么神经网络就能发现恶性肿瘤和普通结节之间的差别,那么在需要少量数据的前提下有可能提高训练速度。这种结构需要不同输入图像之间的关联处理,类似RNN神经网络的结构。所以就需要把RNN和CNN结合起来,采取一种混合结构。当然u-net也引入了在不同层之间的连接,但是并没有引入输入图像之间的差别处理。至于残差网络,和我的思路不一样。也可能是本人对各种网络结构的理解有限,当前还没发现我设想的这种网络结构。本人只是提出了一种假想,当前还没找到具体可行的实现方法。

在AI医学影像处理方面,首先要进行图像的预处理,有时预处理占据很大工作量,经过预处理才能得到训练神经网络所需要的合格数据。但是金博士提出了另外一个观点,那就是在预处理阶段使用深度学习神经网络,有时效果出奇的好,这点对我启发很大。例如在预处理工作中,肺部器官分割很重要。传统方法是使用图像处理的复杂处理过程,但是也可使用u-net网络进行肺部器官分割,效果也很好。

总之,如何获取高质量已标注的大数据,是当前深度学习面临的重大问题,也是遇到的一个瓶颈。对于如何降低人工标注数据的工作量,减少训练集数据量,有下面几种方法:

1:如果能从历史病例中提炼出标签,然后和数据关联,这样就可获取到大量的提供训练的高质量数据,就可大大降低新增人工标注工作量。

2: 先用基于特征知识库去识别,然后再用基于数据驱动的神经网络去识别。

3:迁移学习:先使用普通图像,例如花草动物图像训练网络,然后再用少量的医疗数据去矫正。

4:半监督学习:使用大量的未标记数据,以及同时使用标记数据,来进行模式识别工作。但是半监督学习需要一些前提约束条件,使用场合受限制。

5:弱监督学习:训练数据只给出了弱的粗粒度标签(例如只告诉图片是否是肿瘤,不告诉肿瘤的位置和形状),然后通过训练一个智能算法,将输入数据映射到一组更强的标签的过程。

6:使用生成对抗网络(GAN)来生成大量的可供训练的数据,这样就能大大降低采集训练数据。

7:数据增强(例如翻转、平移等),主要为了较少过拟合,在一定程度上也是增加了训练集。

【作者简介】
平原君,现居北京,互联网&软件行业,历史爱好者。
微信号:pingyuanjun2088

欢迎使用Markdown编辑器

你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。

新的改变

我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:

  1. 全新的界面设计 ,将会带来全新的写作体验;
  2. 在创作中心设置你喜爱的代码高亮样式,Markdown 将代码片显示选择的高亮样式 进行展示;
  3. 增加了 图片拖拽 功能,你可以将本地的图片直接拖拽到编辑区域直接展示;
  4. 全新的 KaTeX数学公式 语法;
  5. 增加了支持甘特图的mermaid语法1 功能;
  6. 增加了 多屏幕编辑 Markdown文章功能;
  7. 增加了 焦点写作模式、预览模式、简洁写作模式、左右区域同步滚轮设置 等功能,功能按钮位于编辑区域与预览区域中间;
  8. 增加了 检查列表 功能。

功能快捷键

撤销:Ctrl/Command + Z
重做:Ctrl/Command + Y
加粗:Ctrl/Command + B
斜体:Ctrl/Command + I
标题:Ctrl/Command + Shift + H
无序列表:Ctrl/Command + Shift + U
有序列表:Ctrl/Command + Shift + O
检查列表:Ctrl/Command + Shift + C
插入代码:Ctrl/Command + Shift + K
插入链接:Ctrl/Command + Shift + L
插入图片:Ctrl/Command + Shift + G
查找:Ctrl/Command + F
替换:Ctrl/Command + G

合理的创建标题,有助于目录的生成

直接输入1次#,并按下space后,将生成1级标题。
输入2次#,并按下space后,将生成2级标题。
以此类推,我们支持6级标题。有助于使用TOC语法后生成一个完美的目录。

如何改变文本的样式

强调文本 强调文本

加粗文本 加粗文本

标记文本

删除文本

引用文本

H2O is是液体。

210 运算结果是 1024.

插入链接与图片

链接: link.

图片: Alt

带尺寸的图片: Alt

居中的图片: Alt

居中并且带尺寸的图片: Alt

当然,我们为了让用户更加便捷,我们增加了图片拖拽功能。

如何插入一段漂亮的代码片

博客设置页面,选择一款你喜欢的代码片高亮样式,下面展示同样高亮的 代码片.

// An highlighted block
var foo = 'bar';

生成一个适合你的列表

  • 项目
    • 项目
      • 项目
  1. 项目1
  2. 项目2
  3. 项目3
  • 计划任务
  • 完成任务

创建一个表格

一个简单的表格是这么创建的:

项目 Value
电脑 $1600
手机 $12
导管 $1

设定内容居中、居左、居右

使用:---------:居中
使用:----------居左
使用----------:居右

第一列 第二列 第三列
第一列文本居中 第二列文本居右 第三列文本居左

SmartyPants

SmartyPants将ASCII标点字符转换为“智能”印刷标点HTML实体。例如:

TYPE ASCII HTML
Single backticks 'Isn't this fun?' ‘Isn’t this fun?’
Quotes "Isn't this fun?" “Isn’t this fun?”
Dashes -- is en-dash, --- is em-dash – is en-dash, — is em-dash

创建一个自定义列表

Markdown
Text-to- HTML conversion tool
Authors
John
Luke

如何创建一个注脚

一个具有注脚的文本。2

注释也是必不可少的

Markdown将文本转换为 HTML

KaTeX数学公式

您可以使用渲染LaTeX数学表达式 KaTeX:

Gamma公式展示 Γ ( n ) = ( n − 1 ) ! ∀ n ∈ N \Gamma(n) = (n-1)!\quad\forall n\in\mathbb N Γ(n)=(n1)!nN 是通过欧拉积分

Γ ( z ) = ∫ 0 ∞ t z − 1 e − t d t   . \Gamma(z) = \int_0^\infty t^{z-1}e^{-t}dt\,. Γ(z)=

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值