我在参加阿里天池O2O比赛中,遇到了一些问题,还有一些概念。其中运用了xgboost模型,xgboost模型在加法模型与前向分布模型基础上进行了延伸。在这里主要记录加法模型的用途及基本操作。
一.加法模型,顾名思义就是将各种东西加起来求个和,这是大体意思,并不是准确的表达。
具体细化到生活中的实例,就比方说你在建一座跨海大桥,需要设计方案,不同的人对此有不同的思路,桥梁专家对于桥梁建设有方案,材料专家对于建桥的材料有思路,海洋专家对于大桥下面的海洋水流有建议,综合不同人的思路及建议,完整的整理相加出一套解决方案。
加法模型的数学抽象(公式):
其中各个参数的含义:
指的是基函数(可以理解为此人对于建桥的意见,例如材料专家给出要使用钢筋混凝土浇筑)
基函数参数(可以理解为此人的特点,例如是桥梁专家,或者是水利专家)
基函数系数(此人的重要性,例如在建桥中,首先要服从桥梁专家,气候专家的意见权重就要小一些)
x指的就是这个问题(建桥问题)
这样一个加法模型的问题就解释清楚了。
二.加法模型同样有缺点,有冗余。就像多种意见中,肯定有很多意见不是那么准确
专业术语中,他就是预测值与真实值的差距。也就是损失函数:
我们要想办法将损失降到最小,于是就用到了:前向分步算法。后期我会慢慢加上。
感谢打赏,手动狗头;)