Sklearn分类树在合成数集上的表现

本文利用Python的Scikit-learn库构建并测试了决策树在月亮型、环形和二分型数据集上的分类效果。通过可视化展示了决策树的决策边界,揭示其在环形数据上的局限性。同时提到了最近邻算法、RBF支持向量机、高斯过程、朴素贝叶斯、神经网络和随机森林在不同数据类型上的优势。
摘要由CSDN通过智能技术生成

版权声明:本文为博主原创文章,未经博主允许不得转载。


我的开发环境是 Jupyter lab,所用的库和版本大家参考:

Python 3.7.1(你的版本至少要3.4以上)

Scikit-learn 0.20.0 (你的版本至少要0.20)

Graphviz 0.8.4 (没有画不出决策树哦,安装代码conda install python-graphviz)

Numpy 1.15.3, Pandas 0.23.4, Matplotlib 3.0.1, SciPy 1.1.0)

在这里,我们使用SKlearn构建三种不同分布的数据,然后在这些数据集上测试一下决策树的效果,让大家更好地理解决策树。下图就是三种表现结果,后面会详细介绍实现过程~

1

1. 导入需要的库

import numpy as np
import matplotlib.pyplot as plt
from matplotlib.colors import ListedColormap
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.datasets import make_moons, make_circles, make_classification
from sklearn.tree import DecisionTreeClassifier

2. 生成三种数据集

我们先从sklearn自带的数据库中生成三种类型的数据集:1)月亮型数据,2)环形数据,3)二分型数据

#make_classification库生成随机的二分型数据
X, y = make_classification(n_samples=100, #生成100个样本
                           n_features=2,  #包含2个特征,即生成二维数据
                           n_redundant=0, #添加冗余特征0个
                           n_informative=2
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值