数据集
守望者白狼
深度强化学习、深度学习、自然语言处理 https://github.com/wolf-bailang
展开
-
人工智能数据集(资源篇)(更新于2020.11.27)
记录机器学习、计算机视觉、自然语言处理、无人驾驶、医疗、金融、政府领域开源的数据集原创 2019-01-07 15:24:12 · 8198 阅读 · 1 评论 -
数据集 搜索
Kaggle:Kaggle是由联合创始人、首席执行官安东尼·高德布卢姆(Anthony Goldbloom)2010年在墨尔本创立的,主要为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。该平台已经吸引了80万名数据科学家的关注。在这个平台中可以找到各种数据,从拉面的评分、篮球数据,到西雅图的宠物牌照应有尽有。UCI机器学习库(UCI Machine Learning ...原创 2019-01-13 15:33:03 · 548 阅读 · 0 评论 -
计算机视觉 数据集(更新于2020.11.27)
belme:数据集中包含大量有标注的图像数据。ImageNet: 是一个用于视觉对象识别软件研究的大型可视化数据库。超过1400万的图像URL被ImageNet手动注释。根据 WordNet 层次结构来组织,其中层次结构的每个节点都由成百上千个图像来描述。LSUN:场景理解与许多辅助任务(房间布局估计,显着性预测等)MS COCO:通用图像的理解和文字描述。COIL 100:在 360 度...原创 2019-01-13 15:37:51 · 2526 阅读 · 0 评论 -
自然语言处理 数据集(更新于2020.04.19)
安然数据集:安然集团高级管理层的电子邮件数据。亚马逊评论:3500万条来自亚马逊的评论,时间长度为18年。数据包括产品和用户信息、评级等。Google Books Ngram:来自Google书籍的词汇集合。博客语料库:从blogger.com收集的681,288篇博客文章。每个博客至少包含200个常用的英语单词。维基百科链接数据(Wikipedia Links data):维基百科全文。...原创 2019-01-13 15:47:06 · 5375 阅读 · 3 评论