sklearn综合示例2:决策树

本文通过scikit-learn库展示了决策树在鸢尾花数据集上的分类应用,包括数据分布矩阵图的绘制、模型训练及预测。同时,提到了决策树的可视化方法和相关参数。
摘要由CSDN通过智能技术生成

scikit-learn 是适用于数据处理和机器学习处理非常强大的库。提供数据降维、回归、聚类、分类等功能,是机器学习从业者的必备库之一。

示例一

案例:鸢尾属植物数据集(iris)分类。
鸢尾属植物数据集一共有 4 个特征,target 值有 3 类,每一类都有 50 个样本。
四维数据集为了在二维平面内展示方便,只选取其中两个维度。

如下所示,绘制出一对特征的数据分布矩阵图,点的颜色表示分类值。
矩阵图主对角线,两幅子图分表表示特征 sepallength、petallength 取值的概率分布图。
绘制下图的代码:

    from sklearn.datasets import load_iris
    import matplotlib.pyplot as plt
    import seaborn as sns

    sns.set(style="ticks")

    df = sns.load_dataset("iris")
    df02 = df.iloc[:,[0,2,4]] # 选择一对特征
    print(df02)
    sns.pairplot(df02, hue="species")
    plt.show()
     sepal_length  petal_length    species
0             5.1           1.4     setosa
1             4.9           1.4     setosa
2             4.7           1.3     setosa
3             4.6           1.5     setosa
4             5.0      
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值