Kimia Path 24
①数据生成方式
基于非临床专家的视觉区分从350个来自不同身体不为的WSI中有意识地手动选择了24个WSI,它们代表着不同的纹理模式
②数据设计及意图
提供一个固定测试数据集以促进基准测试,尊重算法设计者生成自己的训练数据集的设计自由
-
手工选择ROI作为测试patch,其固定大小1000*1000像素,对应0.5mm×0.5mm,共1325个。
-
剩余部分被用于构建训练集,用户灵活创建,可构建从大约27000到超过50000个ptach
-
使用阈值来排除背景,背景被设置为白色
③数据评估标准
- patch-to-scan accuracy: η p = ∑ i = 0 23 ∣ T s i ∩ Γ s i ∣ n \eta_p=\frac{\sum_{i=0}^{23}|T_{s_i}\cap\Gamma_{s_i}|}{n} ηp=n∑i=023∣Tsi∩Γsi∣ 我的理解是平均精度
- whole-scan accuracy: η w = 1 24 ∑ i = 0 23 ∣ T s i ∩ Γ s i ∣ n i \eta_w=\frac{1}{24}\sum_{i=0}^{23}\frac{|T_{s_i}\cap\Gamma_{s_i}|}{n_i} ηw=241∑i=023ni∣Tsi∩Γsi∣ 我的理解是加权平均精度
- total accuracy: η t o t = η p × η w \eta_{tot}=\eta_p×\eta_w ηtot=ηp×ηw 作者在Colored Kimia Path24 Dataset:Configurations and Benchmarks with Deep Embeddings论文中指出设置该精度是既考虑patch-to-scan又考虑whole-scan
④数据实验效果
- 实验一:LBP + 1NN , LBP算子半径取1、2、3;最近邻算法距离度量取L1距离、L2距离、卡方距离
- 实验二:BoW-SPM ,分别对原始图像及LBP谱图进行实验
- 实验三:CNN结构参考Alexnet和VGG16,共分别实验了两种结构,CNN1较深、CNN2较浅。
相关内容
①WSI处理方式:
- 子集方法(sub-setting):从WSI中选择一个重要部分来处理。快速但需要专业知识来选择合适的子集。
- 平铺方法(tiling):将WSI分解为更小且可控的块,对每个块进行处理,在执行上昂贵,但可实现完全自动化。
②病理图像检索历史
-
2003年,Lei Zhang 发明了一个在线的CBIR系统,服务器根据颜色直方图、图像纹理、傅里叶系数和小波系数等特征类型执行相似性搜索,使用余弦距离作为度量值返回与查询图像相似以及相似度分数和特征描述符。所检索图像为显微镜捕捉的675个高质量图片。
-
2009年,Mehta发明了一种离线CBIR系统,该系统对WSI进行平铺处理,使用自动化分割算法分割出组织块图像。根据ROI的SIFT特征对分割组织块图像进行检索。
-
2012年,AKakin和Gurcan开发了多层CBIR系统,第一层对疾病类型进行分类,第二层在对应疾病类型的数据库中进行检索。所检索图像为专家人工裁剪WSI选择的块。
-
2015年,Xiaofan Zhang使用监督核散列技术将10000维特征向量压缩为10个二进制位开发了一种可拓展的CBIR方法。所检索图像为WSI的ROI采样后图像。
③局部二值模式(LBP,Local Binary patterns)
一种极其强大和简洁的纹理特征提取器
一种被证明可量化医学成像中重要纹理的已建立方法之一