《人工智能工程师》树模型初步与进阶笔记

本文详细介绍了决策树模型,包括其基本结构、算法流程和最佳属性选择方法。学习过程中,通过分析训练样本确定划分属性,预测时沿着判定测试序列下行至叶节点。在构建决策树时,主要考虑信息熵、信息增益、信息增益率和基尼指数等指标,用于评估和选择最优属性,从而实现高效的数据划分。
摘要由CSDN通过智能技术生成

1.决策树模型

决策树模型基于‘树的结构’进行决策。

  • 每个内部节点对应某个属性的‘测试’。
  • 每个分支对应于某个测试的一种可能结果(即该属性上的某个取值)。
  • 每个‘叶节点’对应于一个‘预测结果’。

学习过程:通过对训练样本的分析来确定‘划分属性’。(内部节点的属性)

预测过程:将测试事例从根节点开始,沿着划分属性所构成的‘判定测试序列’下行,直到叶节点。


2.算法流程和最佳属性选择

决策树的基本流程:

  1. 总体流程:分而治之    在每个中间节点寻找一个‘划分’属性
  2. 三种停止条件:当前节点包含的样本全属于同一类别,无需划分(样本不一样属性一样划分个啥);当前属性集为空,或是所有样本在所有属性上取值相同,无法划分(样本都一样没办法);当前节点包含的样本集合为空,不能划分(没样本了)。
  3. 基本流程:                                                                                   
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值