cart回归树：练手+sklearn

最新推荐文章于 2024-05-14 17:05:40 发布

iterate7

最新推荐文章于 2024-05-14 17:05:40 发布

阅读量2.2k

点赞数 1

分类专栏：算法基础知识文章标签： cart 回归树 graphviz 决策树

本文链接：https://blog.csdn.net/iterate7/article/details/104462169

版权

本文介绍了CART回归树的基本原理，强调了其在平方差最小化上的目标。通过手动实现和使用sklearn库进行实践，展示了如何构建和评估回归树。数据集regData.txt包含多个样本，用于演示决策树的预测效果。最后，文章建议读者亲自操作以加深对特征选择的理解，并提供了sklearn中决策树回归的实现方式及graphviz的使用提示。

摘要由CSDN通过智能技术生成

背景

cart树作为决策树的一种，在非常多的地方被使用。既可以用于分类问题，也可以用于回归问题。分类问题则非常容易理解，利用gini系数较大的特征进行样本分裂，从而构建一颗分类树。今天我们要探讨的是回归树。

回归树cart简介

回归树，则目标函数是平方差，也就是说，分完之后形成left和right子树，
每个子树对label，也就是y，进行平方差的计算。最后左右子树的平方差之和则是评估标准。我们的目标则是选择平方差之和比较小的特征来进行划分。停止条件则是，没有可划分的，或者误差之和非常小。

练手实现

如果明白了上面的定义，其实就两个点：选特征，目标平方差最小；
分裂；然后继续直到结束。

def loadDataSet():
    dataSet = []
    f = open('regData.txt')
    fr = f.readlines()
    for line in fr:
        line = line.strip().split('\t')
        linef = [float(li) for li in line]
        dataSet.append(linef)
    dataSetMat = mat(dataSet)
    return dataSetMat

def calcErr(dataSetMat):
    '''
    dataSetMat[line,col]
    :param dataSetMat:
    :return:
    '''
    label = dataSetMat[:,-1]
    #print(type(label),len(label))
    sqrtvar = var(label)* len(label)
    #print(sqrtvar)
    return sqrtvar

def chooseBestFeatVal2Split(dataSetMat):
    t = dataSetMat[:, -1]

最低0.47元/天解锁文章

iterate7

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
cart回归树：练手+sklearn

背景cart树作为决策树的一种，在非常多的地方被使用。既可以用于分类问题，也可以用于回归问题。分类问题则非常容易理解，利用gini系数较大的特征进行样本分裂，从而构建一颗分类树。今天我们要探讨的是回归树。回归树cart简介回归树，则目标函数则是平方差，也就是说，分完之后形成left和right子树，每个子树对label，也就是y，进行平方差的计算。最后左右子树的平方差之和则是评估标注。 ...
复制链接

扫一扫