学习笔记:课程来自于 跟李沐学AI
链接如下:https://www.bilibili.com/video/BV1Lf4y1n7LN/?spm_id_from=pageDriver
一、数据的发现
- 有现成的数据集:直接拿来用。
- 没有现成的数据集:需要自己进行数据收集,无法收集的,可以进行数据增强等操作。
二、一些常见的机器学习的数据集
1.机器学习数据集
维基百科中关于数据集的列表:https://en.wikipedia.org/wiki/List_of_datasets_for_machine-learning_research
MNIST:一个手写的数据集。http://yann.lecun.com/exdb/mnist/
ImageNet:从图片搜索引擎获取的图片数据集。https://www.image-net.org/
AudioSet:YouTube的声音切片的数据集。https://research.google.com/audioset/
Kinetics:YouTube的视频切片的数据集。https://deepmind.com/research/open-source/kinetics
KITTI: