Kaggle比赛的网址是https://www.kaggle.com/c/house-prices-advanced-regression-techniques,需要进行一定的操作才能进去。
根据比赛所给数据,可以得到解决问题的思路:
- 数据明确之后就要看到这是个什么问题,易知这是一个回归预测问题;
- 这时候就需要想到哪些算法可以做回归(线性回归、决策树、SVM等);
- 线性回归要什么样的数据才可以用得上;
- 数据中是否含有字符串或者缺失值?如何才能把它们变为数值型;
- 数据特征工程的思路,数据的EDA(pandas_profling)、特征选择,还有就是特征组合或者是特征分割等等;
- 算法的选择;