![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Sklearn成长之路
koko_TT
Show me the code.
展开
-
Sklearn 成长之路(二)构建随机森林并处理Iris数据集
随机森林的简要解释随机森林即采用构建多棵随机树的形式,让这些随机树同时并行处理一组数据,并对各个树的分类结果进行汇总并投票,最终返回随机森林的分类结果。分类结果输出传入数据集包含内容有: [‘data’, ‘target’, ‘target_names’, ‘DESCR’, ‘feature_names’]训练集样本大小: (120, 4)训练集标签大小: (120,)测试集样本大小:...原创 2019-04-16 10:06:06 · 2873 阅读 · 0 评论 -
Sklearn 成长之路(四)处理缺失值NaN或异常值
处理结果填补前:01230NaNNaN0.4602080.2812551NaN0.5502280.4039900.53688420.955809NaN0.5581820.07372330.8222400.497850NaN0.12486440.834690NaN0.3151820.65268550...原创 2019-04-16 15:35:21 · 4187 阅读 · 0 评论 -
Sklearn 成长之路(五)K-means聚类及其评价指标——轮廓系数
聚类结果评价指标——轮廓系数某个点的轮廓系数定义为:s=disMeanout−disMeaninmax(disMeanout,disMeanin)s =\frac{disMean_{out} - disMean_{in}}{max(disMean_{out}, disMean_{in})}s=max(disMeanout,disMeanin)disMeanout−disMeanin...原创 2019-04-16 17:24:17 · 33538 阅读 · 4 评论 -
Sklearn 成长之路(一)利用决策树分类Iris数据并绘制决策树模型结构
决策树处理Iris结果程序输出:传入数据集包含内容有: [‘data’, ‘target’, ‘target_names’, ‘DESCR’, ‘feature_names’]训练集样本大小: (120, 4)训练集标签大小: (120,)测试集样本大小: (30, 4)测试集标签大小: (30,)模型测试集准确率为: 0.9333333333333333决策树模型结构:S...原创 2019-04-13 17:16:55 · 5166 阅读 · 0 评论