cart回归树:练手+sklearn

本文介绍了CART回归树的基本原理,强调了其在平方差最小化上的目标。通过手动实现和使用sklearn库进行实践,展示了如何构建和评估回归树。数据集regData.txt包含多个样本,用于演示决策树的预测效果。最后,文章建议读者亲自操作以加深对特征选择的理解,并提供了sklearn中决策树回归的实现方式及graphviz的使用提示。
摘要由CSDN通过智能技术生成

背景

cart树作为决策树的一种,在非常多的地方被使用。既可以用于分类问题,也可以用于回归问题。分类问题则非常容易理解,利用gini系数较大的特征进行样本分裂,从而构建一颗分类树。 今天我们要探讨的是回归树。

回归树cart简介

回归树,则目标函数是平方差,也就是说,分完之后形成left和right子树,
每个子树对label,也就是y,进行平方差的计算。最后左右子树的平方差之和则是评估标准。 我们的目标则是选择平方差之和比较小的特征来进行划分。 停止条件则是,没有可划分的,或者误差之和非常小。

练手实现

如果明白了上面的定义,其实就两个点:选特征,目标平方差最小;
分裂; 然后继续直到结束。

def loadDataSet():
    dataSet = []
    f = open('regData.txt')
    fr = f.readlines()
    for line in fr:
        line = line.strip().split('\t')
        linef = [float(li) for li in line]
        dataSet.append(linef)
    dataSetMat = mat(dataSet)
    return dataSetMat

def calcErr(dataSetMat):
    '''
    dataSetMat[line,col]
    :param dataSetMat:
    :return:
    '''
    label = dataSetMat[:,-1]
    #print(type(label),len(label))
    sqrtvar = var(label)* len(label)
    #print(sqrtvar)
    return sqrtvar

def chooseBestFeatVal2Split(dataSetMat):
    t = dataSetMat[:, -1]
  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值