HuBMAP - Hacking the Kidney
Identify glomeruli in human kidney tissue images
在人体肾脏组织图像中识别肾小球
赛题介绍
是人类生物分子图谱计划HuBMAP的一部分,希望以单细胞分辨率绘制人类肾脏图谱开始。
…
总之就是大大的好处,造福人类千千万。
奖金
就是特别特别多money
数据集
26G数据集:https://www.kaggle.com/c/hubmap-kidney-segmentation/data
评估
这个比赛使用平局Dice
系数来评估。Dice系数可用于像素级比较predicted segmentation
与其对应的ground truth
之间的一致性。
公式:
其中X是像素的预测集合,而Y是ground truth
。当X和Y都为空时,将Dice系数定义为1。排行榜得分是测试集中每个图像的Dice系数的平均值。
提交文件
为了减小提交文件的大小,官方使用行程编码(run-length encoding)对像素值进行度量。只需要提交包含起始位置和行程长度的值对,不需要提交分割索引的详细列表。例如,“ 1 3”表示从像素1开始,总共走3个像素(1,2,3)。
注意,在编码时,mask应该是二进制的,这意味着图像中所有对象的mask都将合并为一个大的mask。值为0表示not masked
的像素,值为1表示masked
的像素。
比赛格式要求使用空格来分隔每个值对,例如,“1 3 10 5”表示像素1,2,3,10,11,12,13,14将被包括在mask中。度量标准检查值对是否已排序、为正值、以及解码的像素值是否重复。像素从上到下编号,然后从左到右编号:1是像素(1,1),2是像素(2,1),依此类推。从上到下,从左到右依次为像素值编号:1是像素(1,1),2是像素(2,1),依此类推。
该文件应包含标头,并具有以下格式:
img,pixels
1,1 1 5 1
2,1 1
3,1 1
etc.
即:将宽为w
高为h
的图标每个像素一次编号为[1, w*h],然后从编号1开始走,走到第一个mask值开始计算行程长度到非mask,如此为一个值对,(比如编号10到14为mask,一共有5个像素,就记为一个值对:10 5
),直到编号w*h
结束。