MIT-Adobe FiveK Dataset 图片自动下载(自动下载)

官网链接:

MIT-Adobe FiveK dataseticon-default.png?t=N7T8https://data.csail.mit.edu/graphics/fivek/

如何自己下载:

MIT-Adobe FiveK是现在很多做图像增强(image enhancement)与图像修饰(image retouching)方面研究的人员经常会使用到的数据库。这个数据库中包含5000张dng格式的原始图片及分别由五个(A,B,C,D,E)专业修图人员手工修饰后的图片。关于该数据库的详细资料可以在:https://data.csail.mit.edu/graphics/fivek/上找到。博主目前也在作图像增强方面的算法,在该网站上面,虽然提供了原始图片的下载链接,但是修饰后的图片只提供了每个图片的独立下载链接,手工对这些图片一张张下载的话,肯定是一件令人抓狂的事情,因此博主打算应用一个python脚本来自动下载所需要的图片。

  查看网页的源码,发现这些经过修饰后的图片的URL存在一定的规律,例如:由C修饰的第一张图片的URL为https://data.csail.mit.edu/graphics/fivek/img/tiff16_c/a0001-jmac_DSC1459.tif。该地址可以划分为三部分:https://data.csail.mit.edu/graphics/fivek/img/(不变),tiff16_c(代表C修饰的图片,如果最后一个字母是D,那么就代表D所修饰的图片),a0001-jmac_DSC1459.tif(文件名)。发现这一规律之后,我们就可以运用简单的python脚本,通过图片的文件名来将图片下载到本地。

  数据集中所有文件的名称在下载原始图片的时候就可以下载下来,它们被分别放置在名为:filesAdobe.txt和filesAdobeMIT.txt这两个文件中。自动下载的脚本如下:

import os
import sys
from urllib.request import urlretrieve

#改变当前工作路径
CURRENT_PATH="/home/luohang/PyLearn"#本文件所在路径
os.chdir(CURRENT_PATH)#改变当前路径

#存储图像名称的list
img_lst=[]
#读取图片名列表
with open('filesAdobe.txt', 'r') as f:
    for line in f.readlines():
        img_lst.append(line.rstrip("\n"))#去掉换行符

with open('filesAdobeMIT.txt', 'r') as f:
    for line in f.readlines():
        img_lst.append(line.rstrip("\n"))#去掉换行符

#urlretrieve 函数的回调函数,显示下载进度
def cbk(a,b,c):
    '''回调函数
    @a:已经下载的数据包数量
    @b:数据块的大小
    @c:远程文件的大小
    '''
    per=100.0*a*b/c
    if per>100:
        per=100
    #在终端更新进度
    sys.stdout.write("progress: %.2f%%   \r" % (per))
    sys.stdout.flush()

#根据文件的url下载图片
for i in img_lst:
    URL='https://data.csail.mit.edu/graphics/fivek/img/tiff16_c/'+i+'.tif'#下载由C所调整的图像(可根据需要下载其它的四类图像)
    print('Downloading '+i+':')
    urlretrieve(URL, '/media/luohang/软件/FiveK_C/'+i+'.tif', cbk)#将所获取的图片存储到本地的地址内

 

欢迎收藏 加关注

参考链接:

MIT-Adobe FiveK Dataset 图片自动下载 - NewRookie - 博客园 (cnblogs.com)

  • 6
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: MIT-BIH心电图数据库是应用非常广泛的公共心电图数据集之一,最初由美国马萨诸塞理工学院的心律失常分析实验室(MIT-BIH)整理和发布。 主要的数据集划分方式有以下几种: 1. MIT-BIH Arrhythmia数据集 这个数据集被广泛用于心律失常分类器的设计和评估。共包含48个ECG信号,每个信号长30分钟,采样率为360Hz。数据集中包括27种心律失常类型和正常心律类型。 2. MIT-BIH Noise Stress Test数据库 这个数据集用于评估心电图信号处理算法的鲁棒性。它包含两个部分:一部分是干扰信号,涵盖20种可能与心电图信号混淆的干扰形式;另一部分是40个ECG信号,包括各种心律失常和正常心律的组合。 3. Long-term AF数据库 这个数据集包含超过5,000个长时间截面下取得的心电图样本,涵盖普通心律、房颤、房扑、心室颤动等类型,并且每个样本都经过了手动注释。 以上是最常见的MIT-BIH心电图数据库的划分方式,这些数据集的发布为临床医生、研究人员、心电信号处理算法的开发者们提供了一个极为有价值的资源。 ### 回答2: MIT-BIH心电图数据集是用于心律失常检测和分类的广泛使用的数据集,包含48个患者的心电图信号。它被广泛用于研究和开发自动心律失常检测算法。数据集中包含超过100万个心拍,分为5个类别:健康、室性或房性早搏、室性或房性心动过速、室性或房性心动过缓和室颤。 对于这个数据集,常见的划分方式是将数据集划分为训练集和测试集。通常将35个患者的心电图信号作为训练集,其余13个患者的心电图信号作为测试集。这种划分方式可以避免过拟合问题,并且可以对自动心律失常检测算法的性能进行客观评价。在划分数据集时,需要确保训练集和测试集中都有足够的样本代表性。此外,还应该避免将同一组患者的心电图信号同时划分到训练集和测试集中,以避免算法将模型训练到“记住”患者的特定信号而不是正确地学习心律失常的特征。 总的来说,MIT-BIH心电图数据集的划分应该是有代表性的,并遵循一定的规则和标准。只有这样才能保证自动心律失常检测算法的性能和实用性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值