提供数据结构:C16:训练集:
测试集:
标签格式类似于这样,提供测试集的标签列表。
同时可以在对应代码中调整数据目录格式:
超参数:
--data_dir:数据目录。给予按上面格式创建好的根目录。
--p1和--p2:用于实现模型选取前k个关键实例来做计算。
注意给的参数不要带引号,否则地址目录也会带引号导致识别不到正确路径。
报错处理:
1.表示模型没有forward:在dsmil.py文件中模型中def forward需要往右整体移动一个Tab。
2.计算AUC时,报错提醒y_true需要包含两种标签:原因是未正确提供标签格式,如果标签是0、1,那么提供标签格式不是字符‘1’。
3.在使用TCGA数据集时,出现feats的值变成nan的错误
这个问题源于MDMIL在选取前k个关键实例的时候,模型原本按前p1或p2的数据来选取,若WSI过小,只有几十个实例的时候,若p为0.1则k<1,即这种情况下一个关键实例都没有选择,在计算关键实例特征时就会得到nan,因为前0个实例的特征均值无法计算。为了解决nan报错,添加代码保证选取实例数大于等于1就行。