【生物医学的前沿问题】自动识别急性缺血性中风的亚型

最新推荐文章于 2025-10-06 13:15:08 发布

原创

最新推荐文章于 2025-10-06 13:15:08 发布 · 1k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#人工智能 #计算机视觉 #深度学习

本文探讨了如何运用机器学习，特别是深度学习，来识别急性缺血性中风的两种主要亚型——脑栓塞与脑血栓。通过对1000张数字病理切片图像进行分析，建立了数学模型，并详细介绍了数据集划分、模型构建及微调的过程。

作者简介： 本文作者系大学统计学专业教师，多年从事统计学的教学科研工作，在随机过程、统计推断、机器学习领域有深厚的理论积累与应用实践。个人主页

1. 问题描述

迄今为止，中风仍然是世界第二大致死的疾病。在美国，每年约有70万人经历由血凝块阻塞大脑动脉引起的局部缺血性中风。约有23%的中风患者治疗后复发，而第二次中风恶化了患者的生存机会。近十年来，机械血栓清除术已经成为治疗阻塞引起的缺血性中风的标准治疗手段。因此，医疗专家尝试建立数理模型预测缺血性脑中风病原与血凝块来源。本研究使用数字病理切片图像，建立数学模型，分类两种主要的急性缺血性脑中风亚型：脑栓塞与脑血栓。

2. 数据介绍

本研究的数据集由1000张高分辨率的完整数字病理切片图像组成。每张TIFF格式的图像是一个中风患者的血凝块扫描结果。我们将使用这些图像分类患者中风的类型为CE (Cardioembolic) or LAA (Large Artery Atherosclerosis). 根据分类任务，将图像数据集进一步分为训练集与检验集。

3. 数据探索

3.1 训练集与检验集

训练集

在这里插入图片描述

检验集

在这里插入图片描述

其它数据集

在这里插入图片描述

样本数

在这里插入图片描述

3.2 数据统计图

在这里插入图片描述

多张图像的患者统计

在这里插入图片描述

标签统计

在这里插入图片描述

训练集图像大小统计

在这里插入图片描述

示例图像

patient id = 09644e (CE)

在这里插入图片描述
patient id = 91b9d3 (LAA)

在这里插入图片描述

4. 分类模型

4.1 建立数据模型

import shutil

!mkdir -p /kaggle/temp/images/CE
!mkdir -p /kaggle/temp/images/LAA

for _, row in df_train.iterrows()

最低0.47元/天解锁文章