夏令营学习笔记baselin
def extract_feature(path):
# 加载PET图像数据
img = nib.load(path)
# 获取第一个通道的数据
img = img.dataobj[:, :, :, 0]
# 随机筛选其中的10个通道提取特征
random_img = img[:, :, np.random.choice(range(img.shape[2]), 10)]
# 对图片计算统计值
feat = [
(random_img != 0).sum(), # 非零像素的数量
(random_img == 0).sum(), # 零像素的数量
random_img.mean(), # 平均值
random_img.std(), # 标准差
len(np.where(random_img.mean(0))[0]), # 在列方向上平均值不为零的数量
len(np.where(random_img.mean(1))[0]), # 在行方向上平均值不为零的数量
random_img.mean(0).max(), # 列方向上的最大平均值
random_img.mean(1).max() # 行方向上的最大平均值
]
# 根据路径判断样本类别('NC'表示正常,'MCI'表示异常)
if 'NC' in path:
return feat + ['NC']
else:
return feat + ['MCI']
## 知识盲点
### 对于图像维度得了解
`img.dataobj`表示Nifti图像对象的数据内容。具体地说,img.dataobj`是一个4维的数组,其中每个维度代表不同的信息:
* 第一个维度(`:`):表示图像的空间位置x方向的坐标值,从左到右。
* 第二个维度(`:`):表示图像的空间位置y方向的坐标值,从前到后。
* 第三个维度(`:`):表示图像的空间位置z方向的坐标值,从下到上。
* 第四个维度(`0`):表示通道的索引,对于一个多通道的PET图像,可以包含多个通道。
例如,如果PET图像是一个256x256x100的三维图像,并且具有10个通道,那么`img.dataobj`的形状将是`(256, 256, 100, 10)`。通过使用`img.dataobj[:, :, :, 0]`,我们提取了第一个通道的数据,因此结果的形状是`(256, 256, 100)`,即去掉了最后一个维度。这样做是为了提取单个通道的图像进行后续处理。
### 随机提取十个通道的原因
为了统一图片数量
### 特征提取
此次采用的是手动提取特征,作为一个小白是我第一次遇到的,因为之前都是通过卷积提取,有了新的认知