Q1:xbg为啥快?
所谓的并行,是指,每个特征算增益的时候,是并行算的,而不是每棵树是并行算的
Q2:gbd的输入是什么?每棵树的输入是什么?
回答这个问题,要明白,构建每个树,都是为了让总体的loss达到最小。
对于mse,真实y值和前一个树的输出的差即所谓残差作为正好能让总体的loss最小,所以每个树正好是y值残差
但是xbg,每个树的输入,还是原来的数值。但是在构建每个树的时候,至于叶节点的值,是最小化loss导出最大化信息增益然后导出每个节点的w值
Q1:xbg为啥快?
所谓的并行,是指,每个特征算增益的时候,是并行算的,而不是每棵树是并行算的
Q2:gbd的输入是什么?每棵树的输入是什么?
回答这个问题,要明白,构建每个树,都是为了让总体的loss达到最小。
对于mse,真实y值和前一个树的输出的差即所谓残差作为正好能让总体的loss最小,所以每个树正好是y值残差
但是xbg,每个树的输入,还是原来的数值。但是在构建每个树的时候,至于叶节点的值,是最小化loss导出最大化信息增益然后导出每个节点的w值