Kaggle赛题解析:UBC 卵巢癌分类

赛题名称:UBC Ovarian Cancer Subtype Classification and Outlier Detection (UBC-OCEAN)

赛题任务:UBC 卵巢癌亚型分类和异常值检测

赛题类型:计算机视觉、图像分类

赛题链接👇:

https://www.kaggle.com/competitions/UBC-OCEAN/overview

一、比赛介绍

卵巢癌是女性生殖系统中最致命的癌症之一。它有五个常见的亚型:高级别浆液性癌、透明细胞卵巢癌、子宫内膜样癌、低级别浆液性癌和黏液性癌。此外,还有一些罕见的亚型(“离群值”)。所有这些亚型都具有明显的细胞形态、病因、分子和遗传特征以及临床属性。亚型特定的治疗方法逐渐崭露头角,但首先需要进行亚型鉴定,这个过程可以通过数据科学进行改进。

在这里插入图片描述
目前,卵巢癌的诊断依赖于病理学家来评估亚型。然而,这带来了一些挑战,包括观察者之间的分歧和诊断的可重复性。此外,一些未得到充分服务的社区通常缺乏专业病理学家,即使在发达社区中,也面临着专门研究妇科恶性肿瘤的病理学家短缺的问题。

深度学习模型在分析组织病理学图像方面表现出卓越的能力。然而,仍然存在挑战,比如需要大量的培训数据,最好来自单一来源。技术、伦理、财务约束以及保密方面的顾虑使培训变得具有挑战性。在这个比赛中,您将可以访问来自四大洲20多个中心的最广泛和多样化的卵巢癌组织病理学图像数据集。

二、评估指标

比赛的提交将使用"平衡准确度"进行评估,对于测试集中的每个image_id,您需要预测一个label
变量的类别。提交文件应包含一个标题行,并具有以下格式:

image_id,label
2,CC
5,EC
6,HGSC
等等。

三、数据集介绍

这个竞赛使用了隐藏的测试数据。当您提交笔记本进行评分时,实际的测试数据(包括一个完整的示例提交)将可用于您的笔记本。由于数据集的大小,训练图像不会在您的提交笔记本中可用。

[train/test]_images:包含相关图像的文件夹。有两种类型的图像:全切片图像(WSI)和组织微阵列(TMA)。全切片图像是以20倍放大,可以相当大。TMAs较小(大约4000x4000像素),但以40倍放大。测试集包含来自不同来源医院的图像,其中最大的图像尺寸几乎为100,000 x 50,000像素。

[train/test].csv:训练集的标签。

  • image_id 每个图像的唯一ID代码。
  • label 目标类别。是卵巢癌的亚型之一,其中包括CC, EC, HGSC, LGSC, MC, Other。"Other"类别在训练集中不存在;识别离群值是这个竞赛的挑战之一。仅适用于训练集。
  • image_width:图像的宽度(像素)
  • image_height:图像的高度(像素)
  • is_tma:如果幻灯片是组织微阵列,则为True。仅适用于训练集。

[train/test]_thumbnails:包含全切片图像的较小.png副本的文件夹。不提供TMAs的缩略图。

sample_submission.csv:一个有效的示例提交文件。只能下载第一行。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

旅途中的宽~

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值