辛辛苦苦建立起来的数据挖掘模型,往往有效性不能令我们满意,这时就涉及到模型调整的问题。那么调整模型有哪些思路呢?这些思路对模型结果又有多大影响呢?以下是我的一些经验,仅供参考。影响程度数值只是为了大家理解方便和比较,给出了数量级,不具有任何精确性的含义。
1、对商业问题的重新考察与界定,需要我们重新考虑我们定义的商业问题是否合理,目标变量定义是否科学,模型运用思路和模型的选择是否还有调整的可能。这些对模型有效性的影响影响约有百分之几十。
2、对模型变量(自变量或者因变量)的加工与处理。比如:离散化、衍生变量的生成、冗余变量或者相关(共线性强)变量的剔除等。这些对模型有效性的影响大约是百分之十几。
3、模型参数的调整。这些对模型的有效性影响相对来说是最低的,大约只有百分之几。