数据集总览 机器学习的数据存储方式数据管理工具数据集的分类数据集的组成 机器学习的数据存储方式 机器学习的数据一般主要用文件来存储,而不是用数据库来存储数据,主要有以下几点: 1,数据库性能瓶颈,读取速度 2,格式不太符合机器学习要求数据的格式 数据管理工具 数据存储用pandas作为数据读取工具,numpy释放了GIL,实现真正的多线程,速度快 数据集的分类 1,scikit-learn 2,uci 3,Kaggle 数据集的组成 特征值+目标值 行列分别对应特征值和目标值