思考一个问题——比赛中统计特征和比例特征为什么有效?
在比赛中通常使用统计特征和比例特征可以有效的提分!
但是根据梯度提升树中数值变量的计算法则,有统计特征不就行了嘛,为什么还要有比例特征?
我们知道在树中,对于数值变量的划分是先通过排序,然后选择最优划分的。
对于统计特征和比例特征,由于比例特除以了一个自身长度,这可能导致统计特征和比例特征的排序不一样,从而导致切分也不一样。
这就是使用了统计特征,还是使用比例特征的原因
思考一个问题——比赛中统计特征和比例特征为什么有效?
在比赛中通常使用统计特征和比例特征可以有效的提分!
但是根据梯度提升树中数值变量的计算法则,有统计特征不就行了嘛,为什么还要有比例特征?
我们知道在树中,对于数值变量的划分是先通过排序,然后选择最优划分的。
对于统计特征和比例特征,由于比例特除以了一个自身长度,这可能导致统计特征和比例特征的排序不一样,从而导致切分也不一样。
这就是使用了统计特征,还是使用比例特征的原因