学习机器学习时,最好使用真实数据,而不是人工数据集。幸运的是,有上千个开源数据集可以进行选择,涵盖多个领域。以下是一些可以查找的数据的地方:
● 流行的开源数据仓库:
○ UC Irvine Machine Learning Repository
○ Kaggle datasets
○ Amazon’s AWS datasets
● 准入口(提供开源数据列表)
○ http://dataportals.org/
○ http://opendatamonitor.eu/
○ http://quandl.com/
● 其它列出流行开源数据仓库的网页:
○ Wikipedia’s list of Machine Learning datasets
○ Quora.com question
○ Datasets subreddit
机器学习常用数据集
最新推荐文章于 2023-04-10 21:38:46 发布