【ML课程proj】01 懒懒懒 终于开始搜集数据集了

按照课程的要求,我们小组选择了图像间的放射变化这个题目:
其实是因为我感觉仿射变换听起来挺线性的所以就这样选了

图像配准在医学、遥感等领域发挥了 图像配准在医学、遥感等领域发挥了 重要作用。本课题利给定的数据集训练深度神经网络,预测图像之间的空间变换(仿射),完成图像配准工作。

所以这是在医学领域使用到的技术。去看了一眼百科:

图像配准(Image registration)就是将不同时间、不同传感器(成像设备)或不同条件下(天候、照度、摄像位置和角度等)获取的两幅或多幅图像进行匹配、叠加的过程,它已经被广泛地应用于遥感数据分析、计算机视觉、图像处理等领域。

仿射变换是对于不同位置的一种描述(毕竟是 y ⃗ = A x ⃗ + b \vec y=A\vec x+b y =Ax +b的变换),所以本次proj的配准工作要在这个方面对匹配程度进行分析了。

这次用到的dataset来自这些网站

RODREP
FIRE
VARIA
VICAVR Database
INSPIRE
e-ophtha
DIARETDB1
ROC
STARE

看起来数据量还不小……不知道后续处理的时候会遇到多少问题。一个个慢慢看:

  • Rodrep
    官网的描述是Longitudinal diabetic retinopathy screening data,机翻结果 意思是【纵向糖尿病视网膜病变筛查数据】。是眼球的数据,显示了糖尿病患者的视网膜病变情况。
    其中有1170张来自70位病人的眼底图,同时也有相关的其他数据,具体详见网站内容。
    按Continue可以进一步前往下载页,第二步需要提供使用者的信息(名称邮箱单位用途等等),不想提供也可以直接戳右下角的Proceed without registration,然后第三步选择下载完整版数据集(Full Data Set)就好了。
    完整版共有4.6GB的内容。
    “Note that all downloads will be logged by IP address.”

  • Fire
    该数据集由129个视网膜图像组成,形成134个图像对。这些图像对根据其特征分为3个不同的类别。
    图像会具有[Image pair name]_X.jpg的命名格式,其中X为1表示参考图像,2表示测试图像。
    Ground truth文件按照control_points_[Image pair name]_1_2.txt的格式,对每个图像对,格式为
    [reference_point_1_x] [reference_point_1_y] [test_point_1_x] [test_point_1_y]
    直接可以下载,数据集大小为264MB。

  • VARIA
    VARIA数据库是一组用于身份验证的视网膜图像。该数据库目前包括233张图片,来自139个不同的个体。其中的index.txt用于指示图像来源。
    “如果您对使用VARIA数据库感兴趣,请发送电子邮件至:mortega@udc.es 您将收到访问数据库的身份验证密码。这仅用于统计目的,不需要私人数据或费用。”
    目前还没有发送邮件,所以数据情况未能得知。

  • VICAVR
    (仍然要发邮件)
    VICAVR数据库是一组用于计算a/V比率的视网膜图像。该数据库目前包括58幅图像。
    “如果您对使用VICAVR数据库感兴趣,请发送电子邮件至:noelia.barreira@udc.es 您将收到访问数据库的身份验证密码。这仅用于统计目的,不需要私人数据或费用。”

  • INSPIRE
    (还是需要发邮件)
    INSPIRE stands for Iowa Normative Set for Processing Images of the REtina,机翻结果 用于处理视网膜图像的标准装置。
    要使用的话需要在网站内填表,然后会收到访问数据的链接。

  • E-ophtha
    e-ophtha是一个专门为糖尿病视网膜病变(DR)的科学研究而设计的彩色眼底图像数据库。
    “A form with personal information needs to be completed to download the databases.”
    同样需要填表申请

  • DIARETDB1
    这是一个公共数据库,用于从数字图像中检测糖尿病视网膜病变。设计的主要目标是明确定义一个数据库和一个测试协议,可以用来对糖尿病视网膜病变检测方法进行基准测试。通过使用该数据库和定义的测试协议,可以比较不同方法的测试结果。有关更多信息,请参阅文档。
    直接可以下载,数据集大小为141MB。

  • ROC
    这个项目的数据库服务器遇到了一些主要问题,只能通过下载提供图像文件。查看数据、数据批注、注册和提交已不可能。
    需要登记后下载

  • STARE
    STARE(视网膜结构分析)项目是由加州大学圣地亚哥分校的医学博士MichaelGoldbaum于1975年构思和发起的。
    在网站的“Data”页,有一句“The full set of ~400 raw images in the STARE database can be obtained here.”可以按网站链接的here下载数据集,大小为345MB。
    网站同时提供了图像处理的代码和可执行文件。

大概就这些内容。预计未来一阵里要和眼球打交道了。你是医学生?不,我在做ML研究
2021.05.07:还有好多数据集没有登记,所以先就没下载了。

  • 0
    点赞
  • 0
    评论
  • 0
    收藏
  • 一键三连
    一键三连
  • 扫一扫,分享海报

©️2021 CSDN 皮肤主题: 游动-白 设计师:白松林 返回首页
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值