解决几乎任何机器学习问题(完整翻译)
英文原文:Approaching (Almost) Any Machine Learning Problem
Kaggle团队| 07.21.2016
Kaggle大师Abhishek Thakur最初在2016年7月18日在这里发表了这篇文章。
一个数据科学家每天处理大量的数据。有人说,超过60-70%的时间花在了数据清理,数据转移和数据采集上,使得机器学习模型可以应用于这些数据。这篇文章的重点是第二部分,即应用机器学习模型,包括预处理步骤。这篇文章讨论的流水线是我参加过的一百多次机器学习比赛的结果。必须指出的是