题目地址为https://www.kaggle.com/c/liberty-mutual-group-property-inspection-prediction
这里先占个坑,描述大概思路,然后详细介绍怎么做这个比赛。并且承诺最后放出源码。
首先是任务:
In this challenge, your task is to predict a transformed count of hazards or pre-existing damages using a dataset of property information. This will enable Liberty Mutual to more accurately identify high risk homes that require additional examination to confirm their insurability.
预测一个房子的损害程度(hazards),是个数值;这个值可以被公司来参考,高破损值的房屋会检查仔细一些。
其次是数据:
匿名的,不知道代表什么含义,不知道是类别、序数、常规的数值。
任务+数据——建模方法:
第一反应,典型的回归问题;
第二反应,想办法变化特征,可能的类型全部试一下为好;
第三反应,能否用其他模型建模;
第四反应,对于上面所有可能的情况,如何高效地做Ensemble。
之后,会按照上面的思路详细介绍每一步,欢迎大家关注(前提是先去了解数据啊,否则只看没什么长进)。