吴恩达机器学习笔记二十六决策树学习过程独热编码one-hot

爱学习的小仙女！

于 2024-03-22 16:29:02 发布

阅读量382

点赞数 1

分类专栏：机器学习文章标签：机器学习笔记决策树

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/XinxingZh/article/details/136943850

版权

机器学习专栏收录该内容

36 篇文章 0 订阅

订阅专栏

决策树的学习过程

1. 所有样本都在根结点

2.计算所有可能的特征的信息增益，选择信息增益最大的那个

3.根据选择的特征分离数据集，创造左右两支子树

4.继续进行分裂直到达到停止标准。停止标准有：一个节点只有一类样本；分裂一个节点会导致树的深度超过最大值；从新的分裂得到的信息增益低于一个阈值；一个节点中的样本数低于一个阈值。

决策树可以看做一个递归（recursive）的过程

独热编码one-hot

例如猫狗分类，原本耳朵形状这个特征有三个可能的取值，采用独热编码的方式创建三个新的特征，每个特征只有两种情况（0或1），每个特征恰好有一个是1，所以叫独热。也可以推广到其他特征，用0或1来表示特征，可以将数字作为神经网络的输入。

爱学习的小仙女！

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
吴恩达机器学习笔记二十六决策树学习过程独热编码one-hot

例如猫狗分类，原本耳朵形状这个特征有三个可能的取值，采用独热编码的方式创建三个新的特征，每个特征只有两种情况（0或1），每个特征恰好有一个是1，所以叫独热。也可以推广到其他特征，用0或1来表示特征，可以将数字作为神经网络的输入。停止标准有：一个节点只有一类样本；分裂一个节点会导致树的深度超过最大值；从新的分裂得到的信息增益低于一个阈值；一个节点中的样本数低于一个阈值。2.计算所有可能的特征的信息增益，选择信息增益最大的那个。3.根据选择的特征分离数据集，创造左右两支子树。1. 所有样本都在根结点。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。