Python机器学习实战之决策树分类

本文介绍了Python中机器学习的决策树分类方法,详细阐述了决策树算法的工作原理、优点和缺点,如低计算复杂度和易于理解。并解释了构建决策树的过程,包括递归划分节点和确定最佳划分属性的步骤。内容参照了《机器学习实战》一书。
摘要由CSDN通过智能技术生成

决策树

决策树是一种常用的机器学习方法,它基于树的结构,依次根据不同属性值来进行数据分类,具体算法原理及细节可以参考之前写的决策树和MATLAB函数使用

决策树的优点:采用递归进行数据训练、数据分类,因此计算复杂度不高,可以清晰理解哪些属性重要

决策树的缺点:不太适用于连续值的划分(划分节点过多可能造成过拟合),即类别太多时,泛化误差高,一般需要剪枝处理


决策树分类

构建一颗决策树主其实是一个递归的过程,每一层主要需要以下两步:

(1)确定当前节点有无继续划分的需要,不需要划分,则确定当前节点所属类别(或标签)

(2)如果需要划分确定最佳划分属性,继续生成子树


参考《机器学习实战》代码,每一个函数的作用都写了注释

from math import log
import operator


#训练数据,用于创建决策树
def  createDataSet():
    dataSet = [[1,1,'yes']
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值