AI深度、机器学习数据集资源汇总

本文汇总了各类AI和机器学习的数据集资源,包括数据集网站如AI Studio、Kaggle、Graviti等,以及涵盖医疗图像、自然语言处理、计算机视觉等多个领域的具体数据集,方便研究者和开发者进行学习和实践。
摘要由CSDN通过智能技术生成

文章目录

 


前言

继续收集、更新、汇总.......................

 

一、数据集网站

1.AI Studio数据集: 开放数据集-百度AI Studio - 人工智能学习与实训社区

2.天池数据集:数据集-阿里系唯一对外开放数据分享平台

3.Papers With Code数据集:Machine Learning Datasets | Papers With Code

4.Kaggle 数据集:Find Open Datasets and Machine Learning Projects | Kaggle爱竞赛的盆友们应该很熟悉了,Kaggle上有各种有趣的数据集,拉面评级、篮球数据、甚至西雅图的宠物许可证。

5.Graviti Open Datasets:公开数据集下载,优质机器学习数据集,图像识别、NLP免费获取 | 格物钛,非结构化数据平台

6.Huggingface数据集:Hugging Face – The AI community building the future.

7.CLUE 数据集:https://www.cluebenchmarks.com/dataSet_search.html

8.各领域机器学习数据集汇总(附下载地址)

9.UCI机器学习库:最古老的数据集源之一,是寻找有趣数据集的第一站。虽然数据集是用户贡献的,因此具有不同的清洁度,但绝大多数都是干净的,可以直接从UCI机器学习库下载,无需注册。

10.VisualData:分好类的计算机视觉数据集,可以搜索~

二、具体数据集

1.记录的具体数据集

KITTI数据集:The KITTI Vision Benchmark Suite (cvlibs.net)

Cityscapes:Cityscapes Dataset – Semantic Understanding of Urban Street Scenes (cityscapes-dataset.com)

牛津数据集:[Datasets (ox.ac.uk)](https://robotcar-dataset.robots.ox.ac.uk/datasets/)

ApolloScape:[Apollo Scape](http://apolloscape.auto/)

BDD100K:Berkeley DeepDrive

Waymo Open Dataset:GitHub - waymo-research/waymo-open-dataset: Waymo Open Dataset

nuScenes数据集:https://www.nuscenes.org/download

3D Photography Dataset:(uiuc.edu)

Matterport 3D重建数据集:[Capture, share, and collaborate the built world in immersive 3D (matterport.com)](https://matterport.com/)

NoW Dataset:(mpg.de)

Pix3D:[Pix3D (mit.edu)](http://pix3d.csail.mit.edu/)

Replica Dataset:GitHub - facebookresearch/Replica-Dataset: The Replica Dataset v1 as published in https://arxiv.org/abs/1906.05797 .

Scan2CAD:[GitHub - skanti/Scan2CAD: CVPR'19] Dataset and code used in the research project Scan2CAD: Learning CAD Model Alignment in RGB-D Scans

ScanNet:[ScanNet | Richly-annotated 3D Reconstructions of Indoor Scenes (scan-net.org)](http://www.scan-net.org/)

NYC3Dcars:[NYC3DCars (cornell.edu)](http://nyc3d.cs.cornell.edu/)

Expressive Hands and Faces:[Computer Vision Group - Home (tum.de)](https://vision.in.tum.de/)

TUM数据集:[SMPL-X (mpg.de)](https://smpl-x.is.tue.mpg.de/)

EUROC数据集:[kmavvisualinertialdatasets – ASL Datasets (ethz.ch)](https://projects.asl.ethz.ch/datasets/doku.php?id=kmavvisualinertialdatasets)

2.医疗图像

肺结节数据库LIDC-IDRI:LIDC-IDRI - The Cancer Imaging Archive (TCIA) Public Access - Cancer Imaging Archive Wiki

乳腺图像数据库DDSM MIAS:http://deckard.mc.duke.edu/ddsm_sql/book1.html

医学图像问答:Medical Image Format FAQ

ISBI:Challenges - Grand Challenge

3.网上数据集汇总链接

各领域近千条数据集公开,你要的这里都有

1、Kaggle竞赛数据集
2、自然语言处理
3、图像数据
4、推荐系统
5、金融
6、交通
7、商业
8、医疗健康
9、视频数据
10、音频数据
11、文本、评价、回答数据集合
12、科研
13、其他数据集综合

1、Kaggle竞赛数据集

  1. 书籍推荐数据集(goodreads/上万图书/百万评价)【Kaggle】https://www.kaggle.com/zygmunt/goodbooks-10k
  2. 带有预期点数和获胜概率的NFL比赛详情数据集(2009-2016)【Kaggle】https://www.kaggle.com/maxhorowitz/nflplaybyplay2009to2016
  3. HackerNews数据集(2006年以来约1/4文章) 【Kaggle】https://www.kaggle.com/hacker-news/hacker-news-corpus
  4. 酒店评价数据集【Kaggle】https://www.kaggle.com/datafiniti/hotel-reviews
  5. 1950年以来NBA球员状态&表现数据集【Kaggle】https://www.kaggle.com/drgilermo/nba-players-stats
  6. 【Kaggle竞赛】人脸关键点标定竞赛数据:https://www.kaggle.com/c/facial-keypoints-detection
  7. 【Kaggle竞赛】根据手机应用软件使用行为预测用户性别年龄竞赛数据:http://dataju.cn/Dataju/web/datasetInstanceDetail/332
  8. 【Kaggle竞赛】DSTL 卫星图像识别竞赛数据:https://www.kaggle.com/c/dstl-satellite-imagery-feature-detection
  9. 【Kaggle竞赛】猫和狗图像分类数据:https://www.kaggle.com/c/dogs-vs-cats-redux-kernels-edition
  10. 【Kaggle竞赛】根据安检人体扫描成像预测威胁竞赛:https://www.kaggle.com/c/passenger-screening-algorithm-challenge
  11. 【Kaggle竞赛】泰坦尼克灾难数据:https://www.kaggle.com/c/titanic
  12. 【Kaggle竞赛】费城犯罪记录数据:https://www.kaggle.com/mchirico/philadelphiacrimedata
  13. 【Kaggle竞赛】广告实时竞价数据:https://www.kaggle.com/zurfer/rtb
  14. 【Kaggle竞赛】新闻和网页内容推荐及点击竞赛:https://www.kaggle.com/c/outbrain-click-prediction
  15. 【Kaggle数据】IMDB五千部电影数据:https://www.kaggle.com/deepmatrix/imdb-5000-movie-dataset
  16. 【Kaagle数据】欧洲足球运动员赛事表现数据:https://www.kaggle.com/hugomathien/soccer
  17. 【Kaagle数据】世界各国经济发展数据:https://www.kaggle.com/worldbank/world-development-indicators
  18. 开普勒太空望远镜深空星球光强时序数据集【Kaggle】https://www.kaggle.com/keplersmachines/kepler-labelled-time-series-data
  19. 巴基斯坦无人机袭击数据集(2004-2016)【Kaggle】https://www.kaggle.com/zusmani/pakistandroneattacks
  20. 墨尔本房屋市场数据集【Kaggle】https://www.kaggle.com/anthonypino/melbourne-housing-market
  21. 1789-2016历任美国总统签署行政命令数据集【Kaggle】https://www.kaggle.com/nationalarchives/executive-orders
  22. 来自Stack Overflow平台的Python语言问答数据集【Kaggle】https://www.kaggle.com/stackoverflow/pythonquestions
  23. 来自Stack Overflow品台的R语言问答数据集【Kaggle】https://www.kaggle.com/stackoverflow/rquestions
  24. 每日海冰范围数据集【Kaggle】https://www.kaggle.com/nsidcorg/daily-sea-ice-extent-data
  25. NIPS(1987-2016)论文数据集【Kaggle】 https://www.kaggle.com/benhamner/nips-papers
  26. 美国股票新闻数据【Kaggle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/220
  27. 美国医疗保险市场数据【Kaggle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/225
  28. 美国金融客户投诉数据【Kaggle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/229
  29. Lending Club 网贷违约数据【Kaggle数据】 http://dataju.cn/Dataju/web/datasetInstanceDetail/206
  30. 信用卡欺诈数据【Kaggle 数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/206
  31. 美国股票数据XBRL【Kaggle数据】 http://dataju.cn/Dataju/web/datasetInstanceDetail/214
  32. 纽约股票交易所数据【Kaggle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/214
  33. 贷款违约预测竞赛数据【Kaggle竞赛】http://dataju.cn/Dataju/web/datasetInstanceDetail/249
  34. Zillow 网站房地产价值预测竞赛数据【Kaggle竞赛】 http://dataju.cn/Dataju/web/datasetInstanceDetail/249
  35. Sberbank 俄罗斯房地产价值预测竞赛数据【Kaggle竞赛】 http://dataju.cn/Dataju/web/datasetInstanceDetail/266
  36. Homesite 保险定价竞赛数据【Kaggle竞赛】 http://dataju.cn/Dataju/web/datasetInstanceDetail/336
  37. Winton 股票回报率预测竞赛数据【Kaggle竞赛】 http://dataju.cn/Dataju/web/datasetInstanceDetail/347?match
  38. 【Kaggle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/324
  39. Amazon 无锁手机评论数据http://dataju.cn/Dataju/web/datasetInstanceDetail/349
  40. 【Kaggle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/364
  41. 【Kaggle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/207
  42. Kaggle 各项竞赛情况数据【Kaggle数据】 http://dataju.cn/Dataju/web/datasetInstanceDetail/207
  43. Bosch 生产流水线降低次品率竞赛数据【Kaggle竞赛】http://dataju.cn/Dataju/web/datasetInstanceDetail/208
  44. 在线广告实时竞价数据【Kaggle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/337
  45. 购物车商品关联竞赛数据【Kaggle竞赛】 http://dataju.cn/Dataju/web/datasetInstanceDetail/335
  46. Airbnb 新用户的民宿预定预测竞赛数据【Kaggle竞赛】 http://dataju.cn/Dataju/web/datasetInstanceDetail/333
  47. 食物营养成分数据 【Kaggle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/80
  48. EGG 大脑电波形状数据【Kaggle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/79
  49. 某人基因序列数据【Kaggle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/121
  50. 癌症CT影像数据【Kaggle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/242
  51. 软组织肉瘤CT图像数据【Kaggle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/124
  52. 猫和狗分类识别竞赛数据【Kaggle竞赛】http://dataju.cn/Dataju/web/datasetInstanceDetail/318
  53. DSTL 卫星图像识别竞赛数据【Kaggle竞赛】http://dataju.cn/Dataju/web/datasetInstanceDetail/328
  54. 根据手机应用软件使用行为预测用户性别年龄竞赛数据【Kaggle竞赛】 http://dataju.cn/Dataju/web/datasetInstanceDetail/332
  55. 人脸关键点标定竞赛数据【Kaggle竞赛】 http://dataju.cn/Dataju/web/datasetInstanceDetail/331
  56. Kaggle竞赛数据合辑(部分竞赛数据)http://dataju.cn/Dataju/web/datasetInstanceDetail/368
  57. 波士顿Airbnb 公开数据【Kaggle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/209
  58. 世界各国经济发展数据【Kaagle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/202
  59. 世界大学排名芝加哥犯罪数据(2001-2017)【Kaagle数据】 http://dataju.cn/Dataju/web/datasetInstanceDetail/233
  60. 世界范围显著地震数据(1965-2016)【Kaagle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/231
  61. 美国婴儿姓名数据【Kaagle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/222
  62. 全世界鲨鱼袭击人类数据【Kaagle数据】 http://dataju.cn/Dataju/web/datasetInstanceDetail/219
  63. 1908年以来空难数据【Kaagle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/218
  64. 2016年美国总统大选数据【Kaagle数据】 http://dataju.cn/Dataju/web/datasetInstanceDetail/217
  65. 2013年美国社区统计数据【Kaagle数据】 http://dataju.cn/Dataju/web/datasetInstanceDetail/273
  66. 2014年美国社区统计数据【Kaagle数据】 http://dataju.cn/Dataju/web/datasetInstanceDetail/274
  67. 2015年美国社区统计数据【Kaagle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/215
  68. 欧洲足球运动员赛事表现数据【Kaagle数据】 http://dataju.cn/Dataju/web/datasetInstanceDetail/211
  69. 美国环境污染数据【Kaagle数据】 http://dataju.cn/Dataju/web/datasetInstanceDetail/224
  70. 美国H1-B签证申请数据Kaggle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/224
  71. IMDB五千部电影数据【Kaggle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/224
  72. 2015年航班延误和取消数据【Kaggle数据】 http://dataju.cn/Dataju/web/datasetInstanceDetail/226
  73. 凶杀案报告数据【Kaggle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/216
  74. 人力资源分析数据【Kaggle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/259
  75. 美国费城犯罪数据【Kaggle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/260
  76. 安然公司邮件数据【Kaggle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/262
  77. 历史棒球数据【Kaggle数据】http://dataju.cn/Dataju/web/datasetInstanceDetail/263
  78. 美联航 Twitter 用户评论数据【Kaggle数据】 http://dataju.cn/Dataju/web/datasetInstanceDetail/264
  79. 波士顿 Airbnb 公开数据【Kaggle数据】
  • 5
    点赞
  • 40
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值