scikit-learn六大板块:分类,回归,聚类,数据降维,模型选择,数据预处理 数据降维:降低数据的随机变量个数,也称特征选择 模型选择:不同模型,不同参数,同样的训练集,验证集,主要包括格点搜索,交叉验证 模数据预处理:指数据的特征提取和归一化, 重点:注意特征提取和特征选择的区别,特征提取是指将文本,图像等数据转换为可被机器学习的数字变量,特征选择是指去除不重要,重复的特征,特征提取在前,特征选择在后。