人工智能相关数据集分享(二)

商业类数据集

1.在线教育投融数据集(2015-2020年)(513.8KB)
https://www.heywhale.com/mw/dataset/5ec87fddb2aca3003746e28a

2.中国工商企业注册信息数据集(559.4MB)
https://www.heywhale.com/mw/dataset/5cf88a45e727f8002c1e1285

3.8W家中国互联网公司数据(11.3MB)
https://www.heywhale.com/mw/dataset/5ef99d35ff25a1002c1c2641

4.2019年全球七百多万个公司的数据(275.1MB)
https://www.heywhale.com/mw/dataset/5d26a0ea688d36002c589e1d

消费类数据集

1.出行产品未来14个月销量预测数据集(61.2MB)

https://www.heywhale.com/mw/dataset/58bf9bb671db03332e1b85f3

2.口红数据集(1006.6KB)
https://www.heywhale.com/mw/dataset/5c8b2204b4536a002bcd18ae

3.黑五购物数据集(23.8MB)
https://www.heywhale.com/mw/dataset/5c6b6ece336a0d002c18b49c

4.去哪儿网—旅游产品机酒数据(1.5MB)
https://www.heywhale.com/mw/dataset/5cbd31e58c90d7002c816f5d/file

5.全球米其林餐厅信息(100KB+)
https://www.heywhale.com/mw/dataset/5d8080158499bc002c0e2790

6.适合顾客尺码推荐的服装适合数据集(150MB)
https://www.heywhale.com/mw/dataset/5d5faeae8499bc002c0650f5

7.淘宝App用户行为(507.3MB)
https://www.heywhale.com/mw/dataset/5d629b988499bc002c07182e/file

8.淘宝用户行为数据集(164.6MB)
https://www.heywhale.com/mw/dataset/5ef7024363975d002c9235d3/file

9.废旧汽车价格预测数据集(611.6KB)
https://www.heywhale.com/mw/dataset/5d4007c3cf76a600362473ea

10.天猫双十一女性美妆的数据集(3.3MB)
https://www.heywhale.com/mw/dataset/5ce889bed10470002b3394c2

11.淘宝云主题点击数据集(1.6GB)
https://www.heywhale.com/mw/dataset/5da83092c83fb400420c3629

12.广告实时竞价数据(455.5MB)
https://www.heywhale.com/mw/dataset/5de09492ca27f8002c4b03bd

13.9万条上海餐饮数据(6.5MB)
https://www.heywhale.com/mw/dataset/5eb6d24d366f4d002d77f8c3/file

14.天猫订单成交【真实】数据(1.8MB)
https://www.heywhale.com/mw/dataset/5eb60cab366f4d002d779163

住房类数据集

1.链家二手房数据集(5.1MB)
https://www.heywhale.com/mw/dataset/58acf5acd2445916845b402c

2.携程房型产品用户行为数据集(506.1MB)
https://www.heywhale.com/mw/dataset/58d4e28c84a25f34b1d94906

3.房价预测(103.3KB)
https://www.heywhale.com/mw/dataset/5d809a228499bc002c0e381c/file

4.阿姆斯特丹airbnb数据集(400MB+)
https://www.heywhale.com/mw/dataset/5d8b0b13e3ffb2002c456df3/file

5.纽约Airbnb开放数据(6.8MB)
https://www.heywhale.com/mw/dataset/5d66333b8499bc002c08619a

6.房价预测(103.3KB)
https://www.heywhale.com/mw/dataset/5d809a228499bc002c0e381c/file

体育类数据集

1.NBA数据集(62.3+MB)
https://www.heywhale.com/mw/dataset/599a6e66c8d2787da4d1e21d

2.欧洲足球联赛数据集(172.8MB)
https://www.heywhale.com/mw/dataset/5a5d78701badff1e49553679

3.2015-2018MLB棒球常规赛数据集(322.7MB)
https://www.heywhale.com/mw/dataset/5d521a3ac143cf002b21ec27

4.120年奥运历史数据集:运动员和成绩(39.6MB)
https://www.heywhale.com/mw/dataset/5b62ca77a711e60010ab1154

5.科比生涯数据集(5.8MB)
https://www.heywhale.com/mw/dataset/5e3a2a34b8c462002d66a81d

6.NFL大数据可视化(100.8KB)
https://www.heywhale.com/mw/dataset/5ffbecb43441fd00153973e5

植物类数据集

1.蘑菇分类数据集(UCIMachine Learning)(365.2KB)
https://www.heywhale.com/mw/dataset/5a4c87653616537d65c7cdcc

2.iris鸢尾花数据集(4.1KB)
https://www.heywhale.com/mw/dataset/58a942bc7159a710d916af11

3.土壤湿度的高光谱基准数据集(1.6MB)
https://www.heywhale.com/mw/dataset/5cd927fe0ee9cd002ccadc53

4.小麦种子数据集(9.1KB)
https://www.heywhale.com/mw/dataset/5d79f0d68499bc002c0cffaa

5.100种植物种类数据集(35.1MB)
https://www.heywhale.com/mw/dataset/5d5a35f7c143cf002b23fbe7

天文类数据集

1.不明飞行物世纪报告(14.6MB)
https://www.heywhale.com/mw/dataset/5c385c06a105ec002c9bf6fc

2.开普勒望远镜所标注的时间序列数据集(27.6MB)
https://www.heywhale.com/mw/dataset/5a72c5eccec86121fb01aff9

推荐系统数据集

1.资讯内容用户行为数据集(153.3MB)

https://www.heywhale.com/mw/dataset/590a9b28812ede32b73ee412

2.Book Crossing 推荐系统数据(24.9MB)
https://www.heywhale.com/mw/dataset/5dd78542f41512002ceb25f3

3.Jester 推荐系统数据(4MB)
https://www.heywhale.com/mw/dataset/5dd79aedf41512002ceb3a4d

预测类数据集

1.人力资源分析数据集(121.5KB)
https://www.heywhale.com/mw/dataset/5a1fa61ed0178b641c3fa93c

2.申请大学的成功率预测数据集(12.6KB)
https://www.heywhale.com/mw/dataset/5d46929ac143cf002be5b579

3.用户点击预测数据集(516.8MB)
https://www.heywhale.com/mw/dataset/5dddf2a3ca27f8002c4a6483

4.Netflix Price 竞赛数据集(665.7MB)
https://www.heywhale.com/mw/dataset/5dd7837ff41512002ceb24ab

文化娱乐数据集

1.170K+首Spotify歌曲数据集(30+MB)
https://www.heywhale.com/mw/dataset/5ffd443e3441fd00153b17b9

2.TMDB 5000部电影数据集(40MB+)
https://www.heywhale.com/mw/dataset/5daea88575df5c002b212240

3.Disney华特迪士尼电影数据集(181.2KB)
https://www.heywhale.com/mw/dataset/600150ca7ed5ab0015ed911d

其他

1.2017年-2018年关于申根签证的数据集
https://www.heywhale.com/mw/dataset/5d663fb38499bc002c086af9

2.垃圾分类数据(49.3KB)
https://www.heywhale.com/mw/dataset/5d2be1cd688d36002c5a8519

3.二战空袭数据集(27.2MB)
https://www.heywhale.com/mw/dataset/5cbe8f628c90d7002c8217c3

4.拉勾网上海数据分析师职位数据(497.4KB)
https://www.heywhale.com/mw/dataset/5d6b64648499bc002c09942c/file

5.濒危语言统计(736.7KB)
https://www.heywhale.com/mw/dataset/5d273aef688d36002c5932ee

6.CNNVD中国信息安全漏洞数据库
https://www.heywhale.com/mw/dataset/5d81a3088499bc002c0e7642

7.个人睡眠数据(66.1KB)
https://www.heywhale.com/mw/dataset/5d77512e8499bc002c0c55f5

8.2019年世界幸福报告(6.7KB)
https://www.heywhale.com/mw/dataset/5d91aa61037db3002d3b5d53

9.鲍鱼数据集(187.5KB)
https://www.heywhale.com/mw/dataset/5d10447138dc33002bcc050d

10.鱼类毒性数据集(30.5KB)
https://www.heywhale.com/mw/dataset/5da990b9c83fb400420fcf3e

11.人口普查收入数据集(UCI)(3.4MB)
https://www.heywhale.com/mw/dataset/5a336819da263370ab5f29f3

12.足球运动员数据集(3.7MB)
https://www.heywhale.com/mw/dataset/5e79c46b98d4a8002d2cb73c

13.全球各国人口数据数据集(1.9MB)
https://www.heywhale.com/mw/dataset/5eef1709caa99b002d6e3c06

  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Labelme数据集格式是指用于标注图像和语义分割的数据集格式。它包含用于标记图像中目标位置,类别和形状的元数据以及散布在不同目录中的图像本身。这个数据集格式是一个JSON(JavaScript Object Notation)文件,其中包含图像的基本信息如高度、宽度、通道数、文件名等等,还包含标注信息,如目标的类别、位置和形状。此外,Labelme还支持在图像中创建并编辑多边形、矩形、线条和点等的标注工具。 Labelme数据集格式的优点在于可以快速创建和编辑标注数据,同时也能够方便地转换成其他格式,如COCO等。此外,这种格式还支持多人标注,可以同时处理不同人员进行的标注。同时,可视化的图像标注操作也使得该数据集格式非常方便。 总体来说,Labelme数据集格式是充满灵活性和可扩展性的。它是目前用于图像标注和语义分割的主要格式之一,可以帮助开发者和研究人员更好地实现相关的工作。 ### 回答2: Labelme数据集是一个用于计算机视觉和机器学习的开源数据集,包含了许多图像和语义分割的标注。它提供了一种方便的方式来收集、标注和分享图像数据。 Labelme数据集的标注格式是JSON(JavaScript Object Notation)文件,可以通过许多开源工具和库进行解析和处理。在每个JSON文件中,有一些重要的字段,如"version"表示标注版本号,"flags"表示标注标志,"shapes"表示标注形状等等。 在一个"shapes"字段下,通常会列出所有标注的形状信息。每个形状信息包含了一些关键信息,如形状的类型("rectangle", "polygon"等),形状的坐标组成("points"),形状的标注类别("label")等等。 Labelme数据集的格式可扩展,用户可以根据需要自定义字段,例如添加属性来描述颜色、尺寸等属性,以满足不同的应用场景。总的来说,Labelme数据集是一个非常方便的数据集,特别适合用于语义分割、物体检测、图像分割等任务的训练和评估。 ### 回答3: Labelme数据集是一个广泛使用的图像标注数据集,其中包含大量的标注信息,可用于训练机器学习模型和深度学习模型。该数据集是由美国麻省理工学院的人工智能实验室开发的,目前被多个应用和研究领域广泛应用,如计算机视觉和自然语言处理等。 Labelme数据集的格式主要包括图像文件和标注文件两部分,其中图像文件是一系列后缀名为JPG、PNG或BMP的图像文件,包含了需要标注的图像。而标注文件则是一个以JSON格式保存的文件,其中包含了图像中各个物体的坐标、类别等信息。通过这些标注文件,训练模型可以识别并分类图像中的不同物体和图案,实现目标物体识别和图像分割等功能。 在Labelme数据集的标注文件中,每个标注都标记有ID号、类别、位置和颜色等信息,其中,颜色信息用于区分不同的标注。在标注完成后,可使用Labelme软件进行可视化和编辑操作,以便更好地了解和呈现标注信息。 总之,Labelme数据集是一个标注丰富、格式简单、易于使用的图像标注数据集,可以帮助研究者更好地训练和测试图像分割和物体识别算法。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值