数据集整理
文章平均质量分 78
该专栏主要包括:CV领域(风格迁移、超分重建、图像修复),语音领域(语音识别 中英文数据集) ;相关靠谱下载链接整理;欢迎订阅,之后我会不断进行内容补全;谢谢大佬的咖啡!
墨理学AI
计算机视觉领域,新晋砖家 ☞
未来可期,欢迎和墨理一起学 AI 》 博主创建了很多CV领域的技术Club,欢迎主页左侧下方,Contact my WeChat;
展开
-
Benchmarking Chinese Text Recognition: Datasets, Baselines| OCR 中文数据集【论文翻译】
深度学习蓬勃发展的局面见证了近年来文本识别领域的迅速发展。然而,现有的文本识别方法主要针对英文文本。作为另一种广泛使用的语言,中文文本识别在各个领域都有广泛的应用市场。根据我们的观察,我们认为中文文本识别受到关注不足的原因在于缺乏合理的数据集构建标准、统一的评估协议以及现有基准结果。为了弥补这一空白,我们从公开的竞赛、项目和论文中手动收集了中文文本识别数据集。根据应用场景,我们将收集到的数据集分为场景、网络、文档和手写数据集四类。此外,我们在中文文本识别中规范了评估协议。原创 2023-08-31 12:39:12 · 1540 阅读 · 0 评论 -
开放域OOD主要数据集、评价指标汇总
in-distribution data (分布内训练数据集)、OOD test dataset (分布外测试数据集)Evaluation metrics. We evaluate the performance of OOD detection by measuring the following metrics原创 2022-07-27 21:13:08 · 2552 阅读 · 4 评论 -
细粒度识别、分类、检索数据集整理
细粒度相关研究中用到的主要数据集如下:Fine-grained visual classification (FGVC) 相关主要训练和测评数据集如下:CUB-200-2011、Standford Cars、FGVC-Aircraft原创 2022-06-25 11:07:04 · 1851 阅读 · 6 评论 -
maskSet4k 带标签面罩数据集 | N 米下载自荐 | 感谢支持 | 【口罩数据集】
面罩数据集 | 下载收费自荐 | 感谢支持面罩数据集: 为什么是面罩:因为国内口罩类型种类何止千万…,因此这里把凡是类似口罩形状能够完全掩面的图片均标注为带了口罩。原始数据主要来源:SCUT-FBP5500_v2.1–亚洲人脸;明星工作照片(机场、发布会、运动场地)多为爬虫所得;整合其他一些没有 labels 的口罩数据集;我所做的主要加工如下:一:使用pytorch 版本 yolov5 进行二分类 mask 检测,首次模型训练15天,对数据打标;二:数据+标签,人工筛选三:打标数据.原创 2020-11-24 11:20:21 · 1363 阅读 · 1 评论 -
多领域 ASR 英语语料库——GigaSpeech 基本介绍——附有效下载教程
❤️【专栏:数据集整理】❤️ 之【有效拒绝假数据】 ???? Follow me ????,一起学更多有趣 AI、冲冲冲 ???? ????文章目录???? 基础信息???? 数据集介绍???? 下载正确打开方式???? 下载主页 申请入口如下???? 填写必要信息???? 提交成功界面如下???? 很快邮箱收到下载方式说明???? 致敬大佬???? 基础信息https://github.com/SpeechColab/GigaSpeechhttps://arxiv.org/abs/2原创 2021-11-08 11:56:33 · 1698 阅读 · 0 评论 -
深度学习各领域数据集有效整理——持续更新
博客中,任何已经做整理并附分享的CV领域数据集都可以、通过查阅博文、快速获取原创 2021-11-05 00:00:00 · 3061 阅读 · 0 评论 -
多领域中文语音识别数据集 WenetSpeech 正式发布——有效下载教程
DAVIS 挑战赛语义分割数据集【图像分割数据集】数据集下载主页https://davischallenge.org/davis2017/code.html数据集简介可用于图像分割原创 2021-11-02 10:18:43 · 7194 阅读 · 12 评论 -
中文语音数据 - THCHS-30 : A Free Chinese Speech Corpus 【❤️下载介绍❤️】
原英文论文链接THCHS-30数据集官方下载链接原论文数据介绍如下:下载的数据集分析如下:原创 2020-04-08 14:57:50 · 3385 阅读 · 0 评论 -
DAVIS 挑战赛语义分割数据集【语义分割数据集】
❤️【专栏:数据集整理】❤️ 之【有效拒绝假数据】 ???? Follow me ????,一起学更多有趣 AI、冲冲冲 ???? ????文章目录???? DAVIS 挑战赛语义分割数据集【图像分割数据集】???? 数据集下载主页???? 数据集简介???? 下载方式???? 人像分割数据集???? DAVIS 挑战赛语义分割数据集【图像分割数据集】???? 数据集下载主页https://davischallenge.org/davis2017/code.html???? 数原创 2021-10-21 17:57:19 · 1064 阅读 · 2 评论 -
SVT | Street View Text Dataset | Chars74K dataset | 带文本的街景 OCR 数据集
该 Street View Text Dataset 主页:主页链接:http://vision.ucsd.edu/~kai/svt/原创 2021-02-05 15:21:54 · 1241 阅读 · 2 评论 -
A Large Chinese Text Dataset in the Wild | OCR数据集 | 正确下载方式
基本信息A Large Chinese Text Dataset in the WildWild大型中文文本数据集官方主页:https://ctwdataset.github.io/如何下载下载 table 页面https://ctwdataset.github.io/downloads.html点击 this form 链接点击 this form 链接需要进入各个文件,然后逐个点击【目测不需要屉子即可下载喔】排队下载致谢:.原创 2021-06-05 11:49:56 · 719 阅读 · 0 评论 -
大型时尚DeepFashion数据集 ——【DeepFashion】简介
Large-scale Fashion (DeepFashion) Database官网链接http://mmlab.ie.cuhk.edu.hk/projects/DeepFashion.html官方分享链接百度WPhttps://pan.baidu.com/s/1PwJq0U2UPBWKkZvOR2lefQ#list/path=%2F谷歌WPhttps://drive.google.com/drive/folders/0B7EVK8r0v71pQ2FuZ0k0Qn.原创 2021-06-05 10:36:26 · 1730 阅读 · 3 评论 -
人脸检测识别相关数据集整理
DARK FACE: Face Detection in Low Light Condition数据集链接如下:https://flyywh.github.io/CVPRW2019LowLight/该链接页面还有其它两个检测可用数据集:原创 2021-06-02 10:44:54 · 1095 阅读 · 0 评论 -
一个配对的人像分割数据集——云盘分享——图像分割数据集整理
一个配对的人像分割数据集文末关注,后台回复,即可获取一个配对的人像分割数据集数据集介绍:This dataset contains 1700 training images and 300 testing images, along with their respective alpha matte.获取方式如下:后台回复“20210131”获取本博文中的 人像分割数据集 云盘下载链接:20210131...原创 2021-02-02 16:07:40 · 1021 阅读 · 0 评论 -
细分方向论文源码哪里找 | 宝藏链接分享 | 一堆的CV数据集 | May be you need |
作者:墨理三生宝藏链接,CV 同志 值得拥有 主页链接 https://www.robots.ox.ac.uk/~vgg/宝藏链接牛津大学视觉几何学组主页:https://www.robots.ox.ac.uk/~vgg/重点推荐数据链接https://www.robots.ox.ac.uk/~vgg/data/这么好的主页,我居然今天才打开,是我low了呀,让我吃把土冷静一下;...原创 2021-01-12 15:00:21 · 472 阅读 · 0 评论 -
Oxford Buildings Dataset 图像数据集 下载地址| 牛津建筑物 |
数据集名字:Oxford Buildings Dataset声明:文末提供快速下载途径作者:墨理三生数据集链接提供同学ID :编程梦工厂 – https://blog.csdn.net/qq_38831251Oxford Buildings Dataset数据集主页链接数据集用途: 图像检索 ?数据集介绍:下载链接:途径一:我已经把该网站的数据下载链接复制如下,点击即可下载,网络流畅的话,下载会比较快:1 5k Dataset images途径二,云盘下载,.原创 2021-01-12 14:39:40 · 3293 阅读 · 5 评论 -
图像修复 mask 下载 | NVIDIA Irregular Mask Dataset | Quick Draw Irregular Mask Dataset | 【有效分享】 |
NVIDIA Irregular Mask Dataset: Testing Set官方链接如下:https://nv-adlr.github.io/publication/partialconv-inpainting官方下载界面:比较有用的是 NVIDIA Irregular Mask Dataset: Testing Set自行下载有困难同学,欢迎移步最下方快速获取途径;QD-IMD: Quick Draw Irregular Mask Datasetgit 链接: htt.原创 2020-12-08 14:40:45 · 4210 阅读 · 27 评论 -
CASIA WebFace | face recognition data | 人脸识别数据集 | 云盘分享 |
CASIA WebFace 数据集 云盘分享公众号:墨理三生获取方式:关注 墨理三生 ,后台回复 20210102该数据集论文:https://arxiv.org/abs/1411.7923数据集介绍:this paper proposes a semi-automatical way to collect face images from Internet and builds a large scale dataset containing about 10,000 subject.原创 2021-01-07 12:25:52 · 2692 阅读 · 4 评论 -
图像修复使用率最高数据集总结 —— 2020、2021、博文总结 —— 墨理学AI
图像修复使用率最高数据集总结原创 2020-12-23 21:51:05 · 4265 阅读 · 14 评论 -
CMP Facade DataSet 数据集 | 建筑物正面数据集 | 云盘分享 |
作者:墨理订阅蚝:墨理三生文末关注,后台回复 CMPFacade 即可获取数据云盘链接圣诞节了呀,文末关注 墨理三生 ,把我苹果给你吃Facades(建筑物正面) 数据集介绍:CMP Facade Database :Center for Machine Perception (CMP) Facade Database 提供了在机器感知中心收集的正面图像的数据集,其中包括来自各种来源的606幅正面图像,这些图像已经过手动注释。建筑物正面来自世界各地的不同城市,建筑风格各异。下.原创 2020-12-22 18:19:02 · 3092 阅读 · 0 评论 -
PASCAL VOC 2012 dataset、 云盘分享
文末关注,后台回复 VOC2012 即可获取数据云盘链接了解 VOC2012 数据集建议直接去如下大佬文章查阅了解即可,鹅也不小鸡儿啄米,一粒儿一粒儿;原创 2020-12-22 15:16:20 · 1163 阅读 · 3 评论 -
ImageNet 2012 数据集、下载:类名解析 、云盘分享
ImageNet 2012 数据集、下载:类名解析 、云盘分享原创 2020-12-21 15:47:04 · 5073 阅读 · 5 评论 -
places2 数据集 | Data of Places365-Standard 256x256 数据分享| 场景识别数据集 | 【有效整理】|
Data of Places365-Standard 数据介绍:There are 1.8 million train images from 365 scene categories in the Places365-Standard, which are used to train the Places365 CNNs. There are 50 images per category in the validation set and 900 images per category in the t原创 2020-12-09 19:37:13 · 17640 阅读 · 26 评论 -
HWDB1.1数据集 | 手写汉字数据集 |.gnt 转换 .png格式图片| 【❤️有效转换❤️】
我这里对其代码做分析和使用说明:这里是原作者链接,感谢原作者PeppaPeppaPeppa项目目录结构如下:alz 文件解压 方法 教程运行命令:python gnt2png.py gnt2png.py 文件代码只需替换 train_data_dir 和 test_data_dir 的路径即可运行import osimport numpy as npimport structfrom PIL import Image# data文件夹存放转换后的.png文件原创 2020-11-03 20:28:36 · 5026 阅读 · 11 评论 -
The Paris Dataset 图像数据集 下载地址| 巴黎建筑物 |
The Paris Dataset 数据集介绍;本博文的 The Paris Dataset 、不是巴黎街景数据集、二者是不一样的、巴黎街景是主要用于图像修复的数据集;原创 2020-11-17 18:29:27 · 4513 阅读 · 18 评论 -
风格迁移(转换) | 常用数据集 | 【❤️有效整理❤️】
cycleGAN | NiceGAN 论文中使用到的 四个 风格转换数据集下载链接:https://people.eecs.berkeley.edu/~taesung_park/CycleGAN/datasets/下载界面如下:pix2pix 论文中使用到的 5个风格转换数据集(配对的数据)下载链接:https://people.eecs.berkeley.edu/~tinghuiz/projects/pix2pix/datasets/styleGAN 高清人脸数据集https:/.原创 2020-11-12 14:50:30 · 6622 阅读 · 5 评论 -
HWDB1.1数据集下载 | 解压软件 ALZip安装教程 |【❤️有效分享❤️】
CASIA Online and Offline Chinese Handwriting Databases 下载地址Home主页下载链接GitHub项目Handwritten Chinese Character Recognition HWDB1.1trn_gnt.alz 文件解压方法如下 ,使用 ALZip 解压工具即可;分享 ALZip for windows下载链接:一:https://alzip.en.softonic.com/download 这个链接下载可.原创 2020-11-03 16:20:29 · 3494 阅读 · 5 评论 -
水印图像数据集——大规模水印数据集 ——云盘分享
论文《 Towards Photo-Realistic Visible Watermark Removal with Conditional Generative Adversarial Networks 》中提出和使用的大规模水印数据集:分享下载链接如下:链接: https://pan.baidu.com/s/1O3gNDtGlBFqDpphhpMyBWA 提取码: 96gy该数据集用于学术,论文引用如下:****** Citation ******Please cite the fo原创 2020-07-28 14:54:05 · 2525 阅读 · 11 评论 -
超分重建数据集 DIV2K & Flickr2K 下载地址【有效分享】
超分重建数据集 DIV2K & Flickr2K 下载地址【有效分享】、你也在玩超分重建、打开看看、必有收获原创 2020-08-21 10:44:48 · 37832 阅读 · 16 评论 -
Animal Faces| 动物面部 | 数据集
A Large-Scale Hierarchical Dataset of AnnotatedAnimal Faces 论文公开人脸数据集原创 2020-10-20 16:29:07 · 8729 阅读 · 2 评论 -
深度学习公开语音识别数据集下载 | 论文下载|音频数据集|corpus ——简记
各领域公开数据集下载原创 2019-02-13 15:07:07 · 2635 阅读 · 0 评论 -
CelebA-Spoof:具有丰富标注的大规模人脸反欺骗数据集|高清人脸数据集 FFHQ | 下载地址|简记
CelebA-Spoof含有丰富标注信息的大型人脸反欺诈数据集https://arxiv.org/pdf/2007.12342.pdfhttps://github.com/Davidzhangyuanhan/CelebA-Spoof数据下载官网地址:http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html知乎-数据集介绍...原创 2020-09-23 14:25:28 · 3072 阅读 · 10 评论 -
语音数据集下载地址汇总| 免费的汉语说话人识别语料库 | Common Voice 数据集 | 下载总结
TIMIT Acoustic-Phonetic Continuous Speech Corpus GitHub地址TIMIT 语料库 kaggle下载地址,登录Kaggle账号即可下载Mozilla 公司的 Common Voice(输入邮箱即可下载): Mozilla 公司的 CommonVoice...原创 2020-04-14 22:03:53 · 5442 阅读 · 2 评论