数据集
文章平均质量分 54
一个菜鸟的奋斗
这个作者很懒,什么都没留下…
展开
-
V3Det大规模词汇视觉检测数据集与LaRS海上全景障碍物检测数据集
V3Det与LaRS是ICCV2023上发表的数据集工作,规模都比较大,后续有可能会用到,因此记录下来。原创 2023-10-26 17:31:36 · 940 阅读 · 0 评论 -
transforms.normalize如何对特定数据集设定标准化参数
通常ImageNet有自己的标准化参数,是通过抽样统计图像的均值方差得到的,那么针对本地特定数据集,如何获取到适合的参数呢?功能:针对RGB3个 channel 分布对图像进行标准化。将结果写入transform列表中即可。原创 2022-09-08 15:12:54 · 2072 阅读 · 1 评论 -
手把手教你用pytorch实现k折交叉验证,解决类别不平衡
在用深度学习做分类的时候,常常需要进行交叉验证,目前pytorch没有通用的一套代码来实现这个功能。可以借助 sklearn中的 StratifiedKFold,KFold来实现,其中StratifiedKFold可以根据类别的样本量,进行数据划分。以上示例是将所有imgs列表与对应的labels列表进行split,得到train_idx代表训练集的下标,val_idx代表验证集的下标。以上就是实现的基本代码,之所以在代码层面实现k折而不是在数据层面做,比如预先把数据等分为5份。...原创 2022-08-25 09:31:10 · 11063 阅读 · 15 评论 -
python统计子文件夹内图像个数,画图分析类别长尾分布
脚本输出子文件夹的名称,以及对应文件夹下的文件个数。分析出该数据集各个类别的数据分布情况,哪些类别数据较多,哪些类别数据较少,可以针对该情况,对算法分类结果进行分析。原创 2022-08-16 13:55:19 · 986 阅读 · 0 评论 -
PartImageNet物体部件分割(Semantic Part Segmentation)数据集介绍
PartImageNet是发表在ECCV2022的论文,主要是提出了一个当前最大、最全的物体part数据集。数据集下载链接在GitHub上已放出,可以下载。原创 2022-07-29 17:33:45 · 1377 阅读 · 0 评论 -
基于python和md5的相同图片查重
通过爬虫获取的互联网图片,下载下来之后有一些是重复的,人眼检查的话费时费力,而且也很难查全。本文通过计算并比对图片的md5值来判断是否为重复图片,以备后用。python代码如下:上述代码仅提供完全重复图片的查重功能,对于相似图片并不能起到查重功能,后续可加入相似度计算或特征点匹配等方法来实现相似图片的查重。......原创 2022-06-27 15:38:48 · 1717 阅读 · 0 评论 -
Weather天气相关图像数据集统计简介
1. Two-Class Weather dataset 2014http://jiaya.me/projects/weatherclassify/index.htm 已公开2个类别:sunny、cloudy,每个类别5,000张图像。2. MWI (Multi-class Weather Image) dataset 2015https://mwidataset.wee...原创 2019-10-18 13:56:38 · 8248 阅读 · 7 评论