人工智能进入了瓶颈期？_人工智能瓶颈期-CSDN博客

本文链接：https://blog.csdn.net/jiankangyq/article/details/119983337

本文探讨了人工智能，特别是深度学习在医疗领域的应用所面临的挑战，包括高昂的数据获取成本和对大量标注数据的依赖。指出深度神经网络在理论上的瓶颈，以及在数据驱动与知识驱动相结合的可能性，提出混合结构网络模型的设想，以减少训练数据需求。此外，还介绍了降低数据标注工作量的方法，如历史病例提炼标签、特征知识库识别、迁移学习、弱监督学习等。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

标题人工智能进入了瓶颈期？

在搞AI医疗的工作过程中遇到一些问题，进行了思考，这也是很多人工智能厂商面临的问题。
现在的人工智能主要以深度神经网络为主，这是一种靠数据驱动的神经网络：模型可能相同，但是输入的数据不同，则训练出来的神经网络不同；以监督学习为主，需要大量的标签数据，没有高质量的数据AI就变成了无源之水。据说一些人工智能厂商的数据获取成本占据整个公司成本的30%左右。有一句笑话：“人工智能”已经变成了“智能人工”。就是说虽然号称人工智能，却还是需要靠智能的人类去标注数据，去教会AI学习。
拿医疗领域来说，数据获取的成本非常高。因为涉及隐私性和国家法律的保护，加上现在国内的医院之间数据没打通，形成很多信息孤岛，相对比较封闭，所以获取医疗数据难度很大,一般AI厂商都是以科研合作的方式获取数据。即使能获取到医疗数据，还需要有经验的医生标注数据，其实就是让医生教会神经网络如何去识别。这个工作量也不少，占据医生大量时间。而发展相对成熟的AI医学影像辅助诊断系统，都是数据集相对充分的病种，例如肺结节检测&分类。所以现在的AI对数据依赖非常大，如何能在较小训练数据情况下，在保持高精确度的前提下，让神经网络正常工作，是当AI行业面临的重大问题。

具体到医疗行业，以肺结节举例，结节分正常和恶性的，恶性的就可能发展为肺肿瘤。可以想象一下，在指南或者老师指导下，给医生一些CT肺结节的影像，教了几轮后，医生就很容易识别出正常和异常结节。正常结节一般周边光滑，而肿瘤却周边轮廓不清晰，具有沁润性，像树木根部那样具有向周围扩张的分叉特性。人类很容易总结出这些规律（当然对于一些复杂的结节，也需要经验丰富的影像科医生去识别)。但是深度神经网络却需要大量的数据去教训练，不具备总结规律的能力，显得比较笨。

深度神经网络发展到现在，好像遇到了瓶颈期，最近几年很少有理论方面的重大突破，而能发明一种新型网络结构就很不错了。现在更多的AI论文是关于网络模型的微改以及调参。所以有人说，神经网络不是一门科学，而是一门艺术。需要花费大量时间去调参，而调参又没有统一的标准，并且还需要靠数据驱动。

当然说到深度神经网络遇到瓶颈，并没有否定起重要作用。深度神经网络是人类科技发展史上一次重大进步：输入数据，通过误差反馈来调整成千上万个权重和偏移，让网络来适应数据，识别数据，进行分类。只要有大量的数据训练，AI几乎是能进行万能的回归、分类、分割和识别。深度神经网络模拟了人类神经元进行经验学习的结构，但是还没达到人类更高思维阶段。人类如何进行高级思维，需要更多研究才能揭示。我相信如果能科学学术界能搞清楚人类更高的思维方式，例如归纳总结、推演和直觉等，那么必然会推动人工智能上一个台阶。

对于现在AI存在的问题，我和在机器视觉方面的专家金博士讨论过，他也发现这个问题。他提出，应该是两轮驱动：数据驱动和知识驱动。所谓知识驱动就是特征模式识别，根据知识库去区分。例如如果能总结出恶性肿瘤的特征，具有分叉沁润性，边缘不圆滑。这样不需要提供大量的训练数据，就能进行识别。但是这里也存在一个问题，就是恶性肿瘤可能形状千奇百怪，特征描述能否完全归纳覆盖？

另外金博士也发现一个现象，他说在质量检测行业，一个手机屏幕如果出现裂纹，一个几乎没任何先验知识的懵懵懂懂的五岁小孩也能发现问题，认为这是一部有问题的手机，这个小孩并没有经过大量经验的训练。在一次研讨会上他们几个专家也讨论过这个问题，感觉很神奇。所以如何能模拟出人类的思维，人工智能还需要很长的路要走。

在不牺牲精度和误差率的前提下，如何大大降低训练数据数量，不仅仅是一个技术问题，也是一个商业问题，因为这样能大大降低公司的运营成本。

对此我分析了一些原因，提出一些解决的思路。首先个人认为现在的深度学习网络，例如图像方面的卷积神经网络，虽然有不同的感受视野，但是却只是在同一张图内部进行连接共享，图之间并没有进行关联处理，这样就无法发现不同图像之间的差别。我的思路是，如果用肿瘤图像减去正常结节图像，得到他们之间的差，然后把这个差也输入训练，那么神经网络就能发现恶性肿瘤和普通结节之间的差别，那么在需要少量数据的前提下有可能提高训练速度。这种结构需要不同输入图像之间的关联处理，类似RNN神经网络的结构。所以就需要把RNN和CNN结合起来，采取一种混合结构。当然u-net也引入了在不同层之间的连接，但是并没有引入输入图像之间的差别处理。至于残差网络，和我的思路不一样。也可能是本人对各种网络结构的理解有限，当前还没发现我设想的这种网络结构。本人只是提出了一种假想，当前还没找到具体可行的实现方法。

在AI医学影像处理方面，首先要进行图像的预处理，有时预处理占据很大工作量，经过预处理才能得到训练神经网络所需要的合格数据。但是金博士提出了另外一个观点，那就是在预处理阶段使用深度学习神经网络，有时效果出奇的好，这点对我启发很大。例如在预处理工作中，肺部器官分割很重要。传统方法是使用图像处理的复杂处理过程，但是也可使用u-net网络进行肺部器官分割，效果也很好。

总之，如何获取高质量已标注的大数据，是当前深度学习面临的重大问题，也是遇到的一个瓶颈。对于如何降低人工标注数据的工作量，减少训练集数据量，有下面几种方法：

1：如果能从历史病例中提炼出标签，然后和数据关联，这样就可获取到大量的提供训练的高质量数据，就可大大降低新增人工标注工作量。

2: 先用基于特征知识库去识别，然后再用基于数据驱动的神经网络去识别。

3：迁移学习：先使用普通图像，例如花草动物图像训练网络，然后再用少量的医疗数据去矫正。

4：半监督学习：使用大量的未标记数据，以及同时使用标记数据，来进行模式识别工作。但是半监督学习需要一些前提约束条件，使用场合受限制。

5：弱监督学习：训练数据只给出了弱的粗粒度标签（例如只告诉图片是否是肿瘤，不告诉肿瘤的位置和形状），然后通过训练一个智能算法，将输入数据映射到一组更强的标签的过程。

6：使用生成对抗网络（GAN）来生成大量的可供训练的数据，这样就能大大降低采集训练数据。

7：数据增强（例如翻转、平移等），主要为了较少过拟合，在一定程度上也是增加了训练集。

【作者简介】
平原君，现居北京，互联网&软件行业，历史爱好者。
微信号：pingyuanjun2088

欢迎使用Markdown编辑器

你好！这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章，了解一下Markdown的基本语法知识。

新的改变

我们对Markdown编辑器进行了一些功能拓展与语法支持，除了标准的Markdown编辑器功能，我们增加了如下几点新功能，帮助你用它写博客：

全新的界面设计 ，将会带来全新的写作体验；
在创作中心设置你喜爱的代码高亮样式，Markdown 将代码片显示选择的高亮样式 进行展示；
增加了 图片拖拽 功能，你可以将本地的图片直接拖拽到编辑区域直接展示；
全新的 KaTeX数学公式 语法；
增加了支持甘特图的mermaid语法¹ 功能；
增加了 多屏幕编辑 Markdown文章功能；
增加了 焦点写作模式、预览模式、简洁写作模式、左右区域同步滚轮设置 等功能，功能按钮位于编辑区域与预览区域中间；
增加了 检查列表 功能。

功能快捷键

撤销：Ctrl/Command + Z
重做：Ctrl/Command + Y
加粗：Ctrl/Command + B
斜体：Ctrl/Command + I
标题：Ctrl/Command + Shift + H
无序列表：Ctrl/Command + Shift + U
有序列表：Ctrl/Command + Shift + O
检查列表：Ctrl/Command + Shift + C
插入代码：Ctrl/Command + Shift + K
插入链接：Ctrl/Command + Shift + L
插入图片：Ctrl/Command + Shift + G
查找：Ctrl/Command + F
替换：Ctrl/Command + G

合理的创建标题，有助于目录的生成

直接输入1次#，并按下space后，将生成1级标题。
输入2次#，并按下space后，将生成2级标题。
以此类推，我们支持6级标题。有助于使用TOC语法后生成一个完美的目录。

如何改变文本的样式

强调文本 强调文本

加粗文本 加粗文本

标记文本

~~删除文本~~

引用文本

H₂O is是液体。

2¹⁰ 运算结果是 1024.

插入链接与图片

链接: link.

图片: Alt

带尺寸的图片:

居中的图片: Alt

居中并且带尺寸的图片:

当然，我们为了让用户更加便捷，我们增加了图片拖拽功能。

如何插入一段漂亮的代码片

去博客设置页面，选择一款你喜欢的代码片高亮样式，下面展示同样高亮的 代码片.

// An highlighted block
var foo = 'bar';

生成一个适合你的列表

项目
- 项目
  - 项目

项目1
项目2
项目3

计划任务
完成任务

创建一个表格

一个简单的表格是这么创建的：

项目	Value
电脑	$1600
手机	$12
导管	$1

设定内容居中、居左、居右

使用:---------:居中
使用:----------居左
使用----------:居右

第一列	第二列	第三列
第一列文本居中	第二列文本居右	第三列文本居左

SmartyPants

SmartyPants将ASCII标点字符转换为“智能”印刷标点HTML实体。例如：

TYPE	ASCII	HTML
Single backticks	`'Isn't this fun?'`	‘Isn’t this fun?’
Quotes	`"Isn't this fun?"`	“Isn’t this fun?”
Dashes	`-- is en-dash, --- is em-dash`	– is en-dash, — is em-dash