雾天数据集整理
统计整理的信息
- 有哪些数据集:整理不完整,但是除雾的工作没有继续推进,因此本文仅作为先前工作的收尾。
- 数据来源:基本都是“极市”上看到的,网址:https://www.cvmart.net/dataSets/。
- 数据集中哪些数据是可用的:已完成筛选,见正文。
- 这些可用的数据图片大小,后续要如何预处理:见正文。
莫林:研究没有继续,但是对于每个自己花过心思的工作,再花少许经历整理好内容,进行收尾是十分值得的。不然某天你回顾的时候,看到的都是碎片化的资料,你会否定过去自己的努力,认为好像什么都没做。养成总结收尾的习惯!!!
文章目录
数据集名称 | 图片信息 |
---|---|
> DENSEHAZE | 1600×1200×55 |
> | |
I-Hazy | 4657×2833×25(除此之外还有5张图大小不同) |
> NH-Haze | 1600×1200×55 |
RESIDE/SOTS/indoor/nyuhaze | 640×480×50(真值加了白边) 620×460×50 ×10 |
RESIDE/SOTS/outdoor | 比较混乱,选择性使用 |
RESIDE/HSTS | 可用于测试的数据,10张真实有雾图,10组有真值的人工合成有雾图 |
数据集NH-HAZE ——315MB
NH-HAZE_55
- GT——55张图
- hazy——55张图
height of picture: Counter({1200: 55}) width of picture: Counter({1600: 55})
数据集IHAZE——311.7MB
I-HAZY_NTIRE 2018_30——图片质量不错,可用
- GT——30张图
- hazy——30张图
图片简介的数量不对或者是数据上传时丢失
4657 2833 (×25)
4476 2882
4086 2902
4706 3052
4576 3122
4776 3122
数据集DENSEHAZE——234MB
Dense_Haze_NTIRE19_55——图片质量好,可用
- GT——55张图
- hazy——55张图
Width×Height:1600×1200
height of picture: Counter({1200: 55}) width of picture: Counter({1600: 55})
数据集 RESIDE——43.21GB
就HSTS和SOTS数据可用,保留,其他全部删除!
1. HSTS——可用于测试
- real-world——10张图(真实有雾图,没有真值)
- synthetic——合成的图片人眼看比较真实,可用
- original——10张图
- synthetic——10张图
都没用,delete
2. ITS——生成的雾很奇怪+数据量很大,解压后打开不够流畅
train
ITS_clear——1000张图
height of picture: Counter({460: 7897, 407: 2103})
width of picture: Counter({620: 7897, 541: 2103})ITS_haze——10000张图
height of picture: Counter({460: 78970, 407: 21030})
width of picture: Counter({620: 78970, 541: 21030})ITS_trans——10000张图
val
- clear——1000张图
- haze——10000张图
- trans——10000张图
RTTS——没看到
OTS——没看到
5. SOTS——可用
-
indoor
-
nyuhaze500
-
gt——50张图
height of picture: Counter({480: 50})
width of picture: Counter({640: 50}) -
hazy——500张图
height of picture: Counter({460: 500})
width of picture: Counter({620: 500})
-
-
-
outdoor
莫林:如果要使用这一组数据,要么对图片进行整体截图,截取成为统一大小。要么只选取其中大小为413×550的图片。
-
gt——492张图
height of picture: Counter({413: 260, 411: 68, 733: 43, 309: 12, 736: 10, 412: 8,
549: 5, 734: 4, 367: 3, 310: 3, 562: 2, 574: 2, 420: 2, 552: 2, 582: 2, 626: 2, 975: 2, 410: 2, 347: 1, 348: 1, 525: 1, 485: 1, 490: 1, 644: 1, 565: 1, 369: 1, 551: 1, 745: 1, 483: 1, 601: 1, 640: 1, 638: 1, 604: 1, 836: 1, 563: 1, 351: 1, 718: 1, 591: 1, 774: 1, 579: 1, 596: 1, 653: 1, 721: 1, 592: 1, 649: 1, 674: 1, 504: 1, 699: 1, 722: 1, 807: 1, 715: 1, 731: 1, 550: 1, 564: 1, 578: 1, 524: 1, 730: 1, 588: 1, 717: 1, 667: 1, 673: 1, 612: 1, 656: 1, 557: 1, 502: 1, 492: 1, 544: 1, 580: 1, 543: 1, 723: 1, 970: 1, 918: 1, 531: 1, 572: 1, 738: 1, 665: 1, 630: 1, 652: 1})
width of picture: Counter({550: 465, 549: 23, 560: 2, 540: 2}) -
hazy——500张图,图片名称的两个参数是什么意思?
height of picture: Counter({413: 265, 411: 69, 733: 43, 309: 12, 736: 10, 412: 8,
549: 5, 734: 4, 367: 3, 310: 3, 574: 2, 420: 2, 552: 2, 351: 2, 582: 2, 562: 2, 674: 2, 626: 2, 975: 2, 410: 2, 565: 1, 369: 1, 551: 1, 745: 1, 483: 1, 601: 1, 640: 1, 638: 1, 604: 1, 836: 1, 563: 1, 718: 1, 591: 1, 807: 1, 673: 1, 630: 1, 644: 1, 774: 1, 579: 1, 596: 1, 653: 1, 721: 1, 592: 1, 649: 1, 504: 1, 699: 1, 722: 1, 715: 1, 731: 1, 550: 1, 564: 1, 578: 1, 524: 1, 730: 1, 588: 1, 717: 1, 667: 1, 612: 1, 656: 1, 557: 1, 502: 1, 492: 1, 544: 1, 580: 1, 543: 1, 723: 1, 970: 1, 918: 1, 531: 1, 572: 1, 738: 1, 665: 1, 652: 1, 347: 1, 348: 1, 525: 1, 485: 1, 490: 1})
width of picture: Counter({550: 472, 549: 24, 560: 2, 540: 2})真值图0051.png对应的有2张有雾图
真值图0076.png对应的有2张有雾图
真值图0086.png对应的有2张有雾图
真值图0108.png对应的有2张有雾图
真值图0253.png对应的有2张有雾图
真值图0287.png对应的有2张有雾图
真值图0320.png对应的有2张有雾图
真值图0330.png对应的有2张有雾图
processing done!对于高为413的图片宽度统计结果为Counter({550: 260})
对于高为411的图片宽度统计结果为Counter({550: 68})
对于高为733的图片宽度统计结果为Counter({550: 43})
对于高为309的图片宽度统计结果为Counter({550: 12})
对于高为736的图片宽度统计结果为Counter({550: 10})
对于高为412的图片宽度统计结果为Counter({550: 5, 549: 3})
-
不好用的数据,混乱不堪,直接delete
6. UnannotatedHazyImages(Unannotated Real-world Hazy)——4809张没有原图的雾天图片,看样子很像从互联网上爬虫抓取的
数据集 D-Hazy——1.86GB delete
D-HAZY_DATASET
Middlebury_GT——23张图
大小非常不统一!!!这很 drama
2880 1988
2940 2016
2988 2008
2796 1984
3000 1920
2300 1992
2880 1980
2632 1988
2792 2008
2964 2000
2820 1920
2960 1924
2800 1908
2724 1848
2864 1924
2952 2000
2356 1996
2864 2008
2772 1980
2912 2020
2856 2000
2960 2016
2912 1924Middlebury_Hazy——23张图
NYU_GT——2898张图,因为包括真值图片和对应的深度图,所以是有雾图数据量的两倍
height of picture: Counter({480: 1449})
width of picture: Counter({640: 1449})
NYU_Hazy——1449张图,构建的有雾图
数据集 FRIDA(3D)delete
18 个场景共 5 组图片,合计 90 张图,这数量够用吗?——先不说数据够不够用了,它的雾好假!delete
height of picture: Counter({480: 90}) width of picture: Counter({640: 90})
数据集 DAWN——79.35GB delete
恶劣天气交通检测数据集。我看截图以为是最适用我们的应用场景,但实际打开后发现都是用鱼眼相机拍摄的结果。
解压存放位置:软件/DAWN
只用得上第一个,啊啊啊,花那么大精力下载最后只用上一个,我好恨啊!
不使用这组数据了,品质不高
766ygrbt8y-3 (都没有真值,这样的数据集要怎么使用?测试吗?)
- Fog——302张图,无真值
- Rain——202张图
- Sand——325张图
- Snow——206张图
previous_images——8234张图,数据包括FV、RV、MVR、MVL(“Front View”、“Rear View”、“Mirror View Right”、“Mirror View Left”)鱼眼镜头的数据
rgb_images——8234张图,数据包括FV、RV、MVR、MVL,不知道它和上一个文件夹的关系
rgb_images(test_set)——1766张图,数据包括FV、RV、MVR、MVL
soiling_dataset-006
- test——1000张图(FV、RV、MVR、MVL)
- gtLabels
- rgbImages
- rgbLabels
- train——4000张图(FV、RV、MVR、MVL)
- gtLabels
- rgbImages
- rgbLabels
SynWoodScape_V0.1.1-002——数据是仿真合成的
SynWoodScape_V0.1.0中的其他文件夹都不重要,只看
rgb_images,25000张图,数据包括FV、RV、MVL、MVR、BEVWoodScape Dataset——好像是上传资料的人自己没有整理好。
数据集 REVIDE(视频去雾数据集) ——908MB stop
暂时觉得匹配度不够,不下载