sklearn学习决策树算法

最新推荐文章于 2022-10-06 15:42:58 发布

IT独白者

最新推荐文章于 2022-10-06 15:42:58 发布

阅读量2.9k

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/sun_wangdong/article/details/79674444

版权

本文介绍了如何利用Python的sklearn库实现决策树算法。首先，数据集需要经过DictVectorizer转换为数值型数据。接着，可以使用DecisionTreeClassifier进行模型训练和测试。在生成的dot文件无法直观展示决策树结构时，可通过graphviz工具将其转化为PDF，以便查看整棵树的形态。在实际操作中，可能会遇到ValueError：期望2D数组，但得到的是1D数组的问题。

摘要由CSDN通过智能技术生成

python有一个非常棒的机器学习依赖包sklearn，用于实现机器学习的很多算法，本文将介绍用sklearn中的决策树的接口来实现决策树。

决策树是一种用于分类的算法，是一种监督学习算法，具体有id3、c4.5和cart三种算法组成。首先通过csv来导入数据集，注意csv格式是按照每一列以逗号为分隔符的形式。但是因为调用sklearn的包时，需要将数据集的表现格式进行转化，也就是通过也就是比如某一个特征取值为youth、middle_aged和senior，那么会通过转化方式将这三个特征变为如果取youth，那么该值取1，否则取0；如果取middle_aged，那么该值就取1，否则就取0，依次类推。这里sklearn就有一个DictVectorizer类转化工具，用于将一个数据集表示成只包含数值型数据的一个list，这样就可以应用相应的算法进行计算了。

然后就是调用sklearn中的决策树算法来实现，默认tree下关于决策树有两个可以调用的文件，即DecisionTreeClassifier 和 DecisionTreeRegressor两个包，一个用于分类，另一个用于回归。可以用训练集对其进行训练模型，然后用新的测试集对该模型进行测试，

最低0.47元/天解锁文章

IT独白者

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
sklearn学习决策树算法

python有一个非常棒的机器学习依赖包sklearn，用于实现机器学习的很多算法，本文将介绍用sklearn中的决策树的接口来实现决策树。决策树是一种用于分类的算法，是一种监督学习算法，具体有id3、c4.5和cart三种算法组成。首先通过csv来导入数据集，注意csv格式是按照每一列以逗号为分隔符的形式。但是因为调用sklearn的包时，需要将数据集的表现格式进行转化，也就是通过也就是比如某一...
复制链接

扫一扫

专栏目录