Datawhale AI夏令营第三期 - 脑PET图像分析和疾病预测挑战赛——最后的挣扎及总结

本文链接：https://blog.csdn.net/cs6182890/article/details/132504350

最后改了模型又做了数据增强，不过好像还是没什么进步，后面了看别人的笔记，又学了一些上分技巧，在这里分享给大家，由于时间问题目前还没来得及尝试，有空了再试试，看有什么提升。

大佬们的一些上分思路分享

1.从数据出发

对于我们这些搞机器学习的人而言，看到图像第一反应可能就是把图像加载到内存中，作为一个矩阵去跑各种机器学习算法，但我们忽略了一点，那就是图像本身的元数据。

以传统图像为例，其记录的并不仅仅是图片的像素信息，还记录了相机型号、ISO 感光值、GPS 地址等 Exif 信息。而 NIFTI 格式的医疗影像也记录了对应的元数据，俺测试后，仅通过其中的 db_name 字段就能推断出 100 个测试用例中 15 个的标签。

如图上所示，赛题所提供的 db_name 字段存在数据，这里我做了个猜想，若 2 个影像的 db_name 字段相同，则会有同样的标签。对 100 个测试用例对训练集中的样本做匹配，发现了 15 个 db_name 相同的样本

uuid	label	db_name
33	MCI	031_S_0294
36	MCI	036_S_0656
42	MCI	036_S_0945
43	MCI	036_S__1240
46	MCI	041_S_0282
53	MCI	041_S__1010
63	MCI	094_S__1188

uuid	label	db_name
44	NC	005_S_0223
45	NC	005_S_0610
48	NC	009_S_0751
49	NC	011_S_0002
51	NC	011_S_0005
52	NC	011_S_0008
54	NC	011_S_0016
57	NC	011_S_0221

2.计算数据中的各类数据数量

将预测标签全为 NC 的数据交上去后，得到的分数 y 为 0.74214 分，再根据F1 Score公式即可计算出交上去的数据中存在 59 个正常的，显然说明这 100 个测试样例中存在 59 个 NC ，41 个 MCI。

3 构造实验验证标签

前面已经算出， 100 个测试用例中存在 59 个 NC，41 个 MCI。并推断出了其中的 8 个 NC 、7 个 MCI 的编号。前者在数学上被证实了，但后者还只是猜想，得验证才行，这里就构造个简单的实验验证下。如下表的实验。显然，提交成绩与预测成绩吻合，成功石锤这 15 个样例的标签

提交方案	验证 8 个 NC	验证 7 个 MCI	全 NC	全 NC+7 个 MCI 修正
构造方法	对表 3 中的样例，取 NC，其余取 MCI	对表 2 中的样例取 NC，其余取 MCI	全取 NC	对表 2 中的样例，取 MCI，其余取 NC
分数	0.23881	0	0.74214	0.77632
预计成绩	0.23880597	0	这个是参照	0.77631579

二、自己的一些思考

1.PET图像是连续的图像

首先本次比赛使用的PET图像，以下是对PET图像的一些介绍

正电子发射断层扫描（PET）是一种核成像技术（也称为分子成像），可以显示体内代谢过程。PET成像的基础是该技术检测由正电子发射放射性核素（也称为放射性药物，放射性核素或放射性示踪剂）间接发射的γ射线对。将示踪剂注入生物活性分子的静脉中，通常是用于细胞能量的糖。PET系统灵敏的探测器捕获身体内部的伽马射线辐射，并使用软件绘制三角测量排放源，创建体内示踪剂浓度的三维计算机断层扫描图像。

PET-CT头颈癌扫描显示各种图像重建。左上图是显示解剖结构的单独CT扫描。右上角扫描显示融合的PET和CT扫描，添加假色以帮助解释图像。左下扫描是初始FDG PET图像，其显示颈部中的示踪剂热点和由于癌症引起的右颌中的淋巴结。右下图是延迟增强扫描，显示随时间的示踪剂摄取，在膀胱，肾，睾丸和脑中具有正常的热点，其通常具有更高的代谢活性。解剖结构的低级灰色阴影是由于整个身体中FDG的正常细胞代谢摄取。

从上面的介绍可以看出他是一种三维成像技术，就是通过扫描进行三维重建，而且目前的PET都和CT合成在一起了。就像我们平时去做CT的时候，都会从头开始扫描一偏，因此我们其实可以把PET的数据看做是连续的一串数据，而不是Baseline里面的单纯是一堆通道图像

2.作为连续图像，我们也可看做是视频帧图像

如果我们把他看做连续的图像就可以把这个问题转变为视频分类问题

与图像识别相比，视频分类任务中视频比静态图像可以提供更多的信息，包括随时间演化的复杂运动信息等。视频（即使是短视频）中包含成百上千帧图像，但并不是所有图像都有用，处理这些帧图像需要大量的计算。最简单的方法是将这些视频帧视为一张张静态图像，应用CNN识别每一帧，然后对预测结果进行平均处理来作为该视频的最终结果。然而，这个方法使用了不完整的视频信息，因此使得分类器可能容易发生混乱。这看着来挺像本次遇到的情况。如果是视屏分类任务一般可从以下方面改进