常用眼底图像数据集简介及下载--糖尿病视网膜病变 EyePacs,APTOS2019,STARE数据集

1.糖尿病视网膜病变图像介绍

1.微动脉瘤通常出现在病变早期,它是由于眼部毛细血管缺氧导致血管壁变薄,从而在视网膜上呈现出深红色的点状物

2.出血点一般出现在血管附近,它是由于血管阻塞导致血液渗出形成的,呈现暗斑状

3.软性和硬性渗出物的形成代表病变已经到了相对严重的程度,当血管长时间血液供应不良会导致末端毛细血管坏死,这部分坏死的血管就会在视网膜上呈现出大规模亮点状物或者絮状物

4.当眼球长时间处于缺氧状态时,眼球会增生新的血管来获取氧气和血液,增生血管的过程导致患者失明的可能性极大

                                                          病变视网膜眼底图像

下面表格展示的是糖尿病视网膜病变的分类等级标准:

2.常用数据集介绍

   1.Eyepacs数据集

        这也是我目前正在使用的数据集,里面共包含了35126张糖尿病性视网膜眼底图像,分为0-4五个等级,kaggle2019年糖尿病视网膜检测比赛所提供的开源数据,数据集由印度的Aravind眼科医院技术人员前往医疗资源贫乏的农村地区拍摄,然后依靠经验丰富的眼科医生检查图像并进行分类标注。从433 X 289像素到5184 X 3456像素不等在此数据集中,一些图像包含瑕疵、失焦、曝光不足或曝光过度。里面的数据集包含训练集和测试集两部分,因测试集未提供分类标签,故在做分类训练时,只考虑训练集,将训练集的一部分划分为测试集。

训练集也包含两部分,第一部分是包含35126张糖尿病性视网膜眼底图像的eyepacs_train文件夹(图像格式为jpeg),第二部分是所有眼底图像对应的标签文件trainLabels.csv

因训练集中的图片都是混在一起,并未做出分类,故我们需要自己根据给出的csv标签文件来进行分类操作

import os
import shutil
import pandas as pd
import random
 
# 打开表格文件并读取
f = open("E:train1/trainLabels.csv", "rb")  # 打开csv文件
list = pd.read_csv(f)  # 这句不能少
# print(list)
# 创建文件夹
for i in range(3):  # "6"指的是0-5总共6个类别
    if not os.path.exists('E:/train1/' + str(i)):  # 最后一个 / 不要漏
        os.mkdir('E:/train1/' + str(i))
# 进行分类
for i in range(3):
 
    listnew = list[list["level"] == i]  # 对应csv文件标签 那一栏的标题
 
    l = listnew["image"].tolist()  # 对应csv文件图片那一栏的标题
 
    j = str(i)
    for each in l:
        shutil.move('E:/train1/train/' + each +'.jpeg', 'E:/train1/' + j)
print("完成")

文件存放位置:

根据CSV分类标签分类后的结果图:

          1.预处理

                对于预处理,可以做裁剪黑色边框,CLAHE,数据增强等操作。

         2.APTOS2019数据集

                APTOS2019也是从kaggle下载,它由3662张训练图像和1928张测试图像组成,也只有分级标签。该数据集还存在图像和标签中的噪声

3.Messdior数据集 

Messidor是由法国国防研究部在 2004 年资助研究的 TECHNO-VISION 项目中建立的, 也是目前公开的最大的眼底图数据库, 共 1200 幅眼底图, 来自于 3 个不同的眼科机构. 其中图像分辨率分别为 1440×960, 2240×1488 和 2304×1536, TIFF 格式; 它给出了对应糖尿病视网膜病变分期和黄斑性水肿症状, 同时给出了专家手动标定的视盘, 也是常用的眼底图像库。

Messidor:这包含1200张眼底图像,但其DR分级标准与之前的数据集不同,只有四个级别(0到3)。除了DR分级外,还为每个分级标签为0到2的图像提供了黄斑水肿的风险
原论文:
[1]Decencière E, Zhang X, Cazuguel G, et al. Feedback on a publicly distributed image database: the Messidor database[J]. Image Analysis & Stereology, 2014, 33(3): 231-234.

 4.STARE数据集

STARE(视网膜结构分析)项目是由加州大学圣地亚哥分校的医学博士迈克尔·戈德鲍姆于1975年构想并发起的。该研究由美国国立卫生研究院资助。在它的历史上,超过30人为这个项目做出了贡献,他们的背景从医学到科学到工程。图像和临床数据由加州大学圣地亚哥分校的希利眼科中心和圣地亚哥退伍军人管理局医学中心提供。下载方式也是在kaggle下载。

 5.下载路径

可以W X (浩浩的科研笔记)下载

主要是为了分享,数据集都是在kaggle上自己下载的,有问题可以留言,免费解答

  • 7
    点赞
  • 82
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值