利用CNN实现图像和数值数据融合

最新推荐文章于 2025-02-28 15:20:38 发布

JaysonWong

最新推荐文章于 2025-02-28 15:20:38 发布

阅读量8.1k

点赞数 9

分类专栏：机器学习文章标签： cnn 深度学习神经网络

本文链接：https://blog.csdn.net/JaysonWong/article/details/126628707

版权

本文介绍了如何利用CNN结合MRI图像和数值数据进行融合，以提升医疗领域的预测准确性。通过三种融合方法对比，重点探讨了CNN在特征提取上的优势。文章展示了训练CNN模型、提取图像特征并与数值数据拼接的步骤，并以FashionMNIST和Iris数据集为例进行演示。最终，通过决策树模型展示了融合数据的预测效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

利用CNN实现图像（MRI）和数值数据融合

一、背景

在很多实际任务当中，模型构建数据类型多样，有数值型、图像、音频等各式各样的数据，如果单纯利用某种类型的数据构建分类或回归模型，好处是构建简单，数据不存在类型不同融合困难的问题，但如果单纯的利用某一种数据且模型性能一般，如accuracy在0.6-0.7之间徘徊，那有必要纳入更多的特征，特别是在医疗领域，部分数值型数据本来的可分性就不好，因此要纳入一部分的图像数据，如早期预测一个人是否会患某种疾病，训练集样本均为正常人，此时无论是数值型数据或影像数据，区别并不大，因此要考虑融合二者来提升预测的准确性。

二、目前常用的图像和数值型数据融合的方式

目前来说，把图像和数值型数据融合方式有三种：

1、直接把图像转为向量

这种方法是最暴力的解法，如一张32X32像素的彩色图片，其转化为向量为32X32X3=3072，相当于纳入了3072个特征，优点是纳入了所有图像中的细节（像素级），缺点是由于纳入了所有的细节（像素），会不必要的有一部分混杂因素，因此需要复杂的特征工程，另一方面，其计算量会大大增加，导致模型拟合或后期应用出现问题。

2、利用软件提取图像中的某些特征

在这里插入图片描述如上面的这张颅脑磁共振成像，利用某些软件如FSL，可以提取丘脑、海马体、脑皮厚度、脑容量等参数，之后把这部分参数当作新的特征和数值型数据融合，优点是大大减少了特征数，提升了计算速度，缺点是一些器质性病变无法体现。

3、利用CNN（卷积神经网络）

在这里插入图片描述
CNN也可以用来提取特征，前提是该模型预测准确性较好，自然相当于提取的特征较为准确，一般是在卷积基后的flatten层和数值型数据拼接在一起，实现图像和数值型数据的融合，具体如上图所示。

三、CNN实现图像和数值型数据融合的步骤

1、训练CNN网络

这一步是整个融合过程中较为重要的步骤，只有较为准确的CNN网络才能提取准确有用的特征，一般采用预训练+微调的模式来训练CNN，为了演示方便，我们采用Fashion MNIST数据集来为我们的图像，iris数据集作为我们的数值型数据，来做演示。另外由于Fashion MNIST类别有10中，而iris只有3种，我们之纳入irsi的数据来“假定为我们图像配套的数值型数据”，新建一个py文件，具体代码如下：

import tensorflow as tf
import matplotlib.pyplot as plt
from tensorflow import keras
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'


# 加载数据
fashion_mnist = tf.keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()
# 查看数据大小
# print(train_images.shape)
# print(test_images.shape)
# 数据集归一化
train_images_norm = train_images / 255.0
test_images_norm = test_images / 255.0
train_images_reshape = train_images.reshape([-1, 28, 28, 1])
test_images_reshape = test_images.reshape([-1, 28, 28, 1])

L = keras.layers
model = keras.Sequential([
    # 卷积层
    L

最低0.47元/天解锁文章