搜狗实验室数据资源
http://www.sogou.com/labs/resource/list_pingce.php
自然语言处理与信息检索共享平台
http://www.nlpir.org/?action-category-catid-28
Chinese Word Vectors:目前最全的中文预训练词向量集合
图像分类数据集:
CIFAR10(The Canadian Institute For Advanced Research)是衡量机器学习模型好坏的一个公共数据集,主要目的是将32x32的RGB图片分类成以下的10个类型:
airplane, automobile, bird, cat, deer, dog, frog, horse, ship, and truck
http://academictorrents.com/details/463ba7ec7f37ed414c12fbb71ebf6431eada2d7a
参考:
http://blog.csdn.net/u012052268/article/details/78035272