【模型训练数据集的查找与下载】

覆盖全网99.5%的公开深度模型数据集(附下载方式,赶紧收藏!))

一、三个网站(持续更新…)

1、https://academictorrents.com/ Academictorrents:127.15TB公开使用的研究数据集

2、https://paperswithcode.com/datasets Paperswithcode:6718个常用数据集

3、https://www.kaggle.com/datasets Kaggel:备选

二、下载详解

1、Academictorrents

  • 搜索mnist数据集、选择一个mnist数据集、下载数据集种子文件

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ShocZ366-1660615200279)(https://s3-us-west-2.amazonaws.com/secure.notion-static.com/28dadddc-d0ee-47e5-b03d-a00f293b767f/Untitled.png)]
在这里插入图片描述
在这里插入图片描述

  • 下载种子文件

(1)点击链接,进入下载界面下载种子下载器https://transmissionbt.com/download/

(2)打开种子下载器安装程序,一路安转成功。打开软件运行(忽略我这里下载过的历史记录)
在这里插入图片描述

(2)将种子文件拖至软件内部即可下载
在这里插入图片描述
在这里插入图片描述

2、Paperswithcode

  • 搜索mnist数据集,点击进入下载即可

在这里插入图片描述

3、Kaggle

搜索mnist数据集,选择以google登录或注册登录,点击下载即可

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-DyBvQfHI-1660615131598)(https://s3-us-west-2.amazonaws.com/secure.notion-static.com/696dfb2f-03fc-4910-a37d-18b0213503a6/Untitled.png)]
在这里插入图片描述

  • 4
    点赞
  • 39
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
496,835 条来自 AG 新闻语料库 4 大类别超过 2000 个新闻源的新闻文章,数据集仅仅援用了标题和描述字段。每个类别分别拥有 30,000 个训练样本及 1900 个测试样本。 README: AG's News Topic Classification Dataset Version 3, Updated 09/09/2015 ORIGIN AG is a collection of more than 1 million news articles. News articles have been gathered from more than 2000 news sources by ComeToMyHead in more than 1 year of activity. ComeToMyHead is an academic news search engine which has been running since July, 2004. The dataset is provided by the academic comunity for research purposes in data mining (clustering, classification, etc), information retrieval (ranking, search, etc), xml, data compression, data streaming, and any other non-commercial activity. For more information, please refer to the link http://www.di.unipi.it/~gulli/AG_corpus_of_news_articles.html . The AG's news topic classification dataset is constructed by Xiang Zhang ([email protected]) from the dataset above. It is used as a text classification benchmark in the following paper: Xiang Zhang, Junbo Zhao, Yann LeCun. Character-level Convolutional Networks for Text Classification. Advances in Neural Information Processing Systems 28 (NIPS 2015). DESCRIPTION The AG's news topic classification dataset is constructed by choosing 4 largest classes from the original corpus. Each class contains 30,000 training samples and 1,900 testing samples. The total number of training samples is 120,000 and testing 7,600. The file classes.txt contains a list of classes corresponding to each label. The files train.csv and test.csv contain all the training samples as comma-sparated values. There are 3 columns in them, corresponding to class index (1 to 4), title and description. The title and description are escaped using double quotes ("), and any internal double quote is escaped by 2 double quotes (""). New lines are escaped by a backslash followed with an "n" character, that is "\n".
引用\[1\]:运行完成后,在training_myself/dataset/COCO/目录下得到一个mask2014/目录,里面是未标注人的图片。将这个文件夹拷贝到training_myself/dataset/COCO/images/目录下以便后续处理。引用\[2\]:由于要训练自己的数据集,所以就需要人工标注数据,使用软件为labelme。该工具非常好用,基本可以满足深度学习众多任务的数据标注需求。引用\[3\]:按照编译官方最新的caffe的方法来编译这个用于训练openpose模型的caffe_train会遇到很多错误,主要原因我认为是这个caffe_train有点过时了,里面的部分源码都是很老版本的caffe中的。而我们所用的一些caffe相关的工具,软件,库肯定都是较新的版本。 针对openpose改进训练数据集的问题,可以采取以下步骤: 1. 首先,确保你已经准备好了自己的数据集,并使用labelme等工具进行人工标注。将标注好的数据集放置在合适的目录下,以便后续处理。 2. 接下来,你可以根据自己的需求对数据集进行改进。例如,你可以增加更多的样本,以增加数据集的多样性和覆盖范围。你还可以对标注的准确性进行检查和修正,确保每个位置的标注足够准确。 3. 此外,你还可以根据需要对数据集进行筛选,去除一些特征不明显或不符合要求的样本,以提高训练的准确率。 4. 如果你遇到了编译caffe_train的问题,可以尝试查找最新的编译方法或使用更新的版本。确保你使用的工具、软件和库与你所使用的openpose版本兼容。 通过以上步骤,你可以改进训练数据集,使其更适合用于openpose模型训练。 #### 引用[.reference_title] - *1* *3* [OpenPose训练自己的数据集模型Realtime Multi-Person Pose Estimation](https://blog.csdn.net/qq_38469553/article/details/82119292)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [OpenPose(tensorflow)工程详解系列(一)—— 制作训练数据集](https://blog.csdn.net/kxh123456/article/details/114531371)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值