寻找数据集
弄个合适的数据集,也是一门技术活。
数据集获取一般可以通过以下 3 个渠道:
写爬虫,爬各大网站的图片数据,然后使用自己的接口清洗或者人工标注;
将需求提交给数据标注团队,花经费标注数据。
前两个是要么得有技术、要么得有钱。
最后一个方法,就得碰运气了。翻论文,找公开数据集,或者去 AI 比赛网站或者 AI 开放平台碰碰运气。
比赛,比如可以去 Kaggle 搜一搜数据集。
URL:https://www.kaggle.com/
AI 开放平台,可以去 AI Studio看看。
URL:https://aistudio.baidu.com/aistudio/datasetoverview