sklearn调包侠
文章平均质量分 70
追梦小凯
统计在读|强逻辑遵守者|知识偏好型选手|计算机金融|web3探索中|棋手|
展开
-
sklearn 之 PCA降维算法
sklearn.decomposition.PCA重要接口:fittransform:用训练好的模型对数据进行转换fit_transform:二合一inverse_transform:【pca.inverse_transform(数据集) ,就是把降维后的数据集按照原来的框架升维回去,但不能完全将数据重置回去,可以用来降噪】重要参数n_components:根据我们的降维目标来选取,如果我们希望可视化一组数据来观察数据分布,我们往往将数据降到三维以下,很多时候是二维,即n_componen原创 2022-03-07 16:16:54 · 2599 阅读 · 0 评论 -
sklearn 之 数据预处理与特征工程
模块总览模块preprocessing:几乎包含数据预处理的所有内容模块Impute:填补缺失值专用模块feature_selection:包含特征选择的各种方法的实践模块decomposition:包含降维算法数据预处理数据的无量纲化preprocessingpreprocessing.MinMaxScaler(数据归一化:Normalization,又称Min-Max Scaling)x∗=x−min(x)max(x)−min(x)x^*=\frac{x-min(x)}{max原创 2022-03-07 16:11:35 · 1175 阅读 · 0 评论 -
sklearn 之 随机森林
随机森林sklearn.ensemble.RandomForestClassifier随机森林是集成算法的一种,它属于集成算法中的装袋法,根据袋子里面的基评估器来做出综合的判断,所以要求每个基评估器评估的结果准确率高于50%基评估器重要参数(就是决策树)criterion不纯度的衡量指标,有基尼系数和信息熵两种选择max_depth树的最大深度,超过最大深度的树枝都会被剪掉min_samples_leaf一个节点在分枝后的每个子节点都必须包含至少min_samples_leaf个训练样本,否则分原创 2022-03-07 16:10:19 · 432 阅读 · 0 评论 -
sklearn 之决策树与回归树
sklearn调包日记原创 2022-03-07 15:59:43 · 803 阅读 · 0 评论