机器学习之-回归树-具体怎么实现及应用

本文介绍了回归树的构建方法,包括字典存储树结构、CART算法、模型树算法,以及ID3算法的优缺点。同时,讨论了如何处理连续型数据的混乱度,并提到了Python GUI库Tkinter在构建交互界面时的应用。最后,详细阐述了回归树的建立过程,包括数据切分、递归创建、剪枝策略,以及模型树的差异。
摘要由CSDN通过智能技术生成

1、连续和离散型特征的树的构建:

用字典来存储树的数据结构,包含4个元素:

a)待切分的特征

b)待切分的特征值

c)右子树。当不再需要切分的时候,也可以是单个值。

d)左子树。与右子树类似。

//2017/6/6

1、CART(classification and regression trees,分类回归树),可以用于分类和回归,值得学习。

2、模型树算法:

与回归树的做法(在每个叶节点上使用各自的均值做预测)不同,该算法需要再每个节点上都构建出一个线性模型。

3、ID3算法的优缺点:

ID3的做法每次选取当前最佳的特征来分割数据,并按照该特征的所有可能取值来切分,一旦切分后,该特征将不再起作用,因此有观点认为这种切分方式过于迅速。

另外:ID3算法不能直接处理连续型特征,只有事先将连续型特征转为离散型,才能在ID3算法中使用。

4、如何计算连续型数据的混乱度?

计算均值,求每条数据到均值的差值(平方值或绝对值)。

//2017/6/8

1、Python交互式GUI:Tkinter

由一些小部件(widget)组成:文本框、按钮、标签、复选框等对象。

还有一些布局管理器:grid()就是把部件放在一个二维表格中,可以设定部件在二维表格中的位置,从(0,0)位置开始。

Tk()用于创建根部件。

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值