文章目录
一、房价预测比赛介绍
房价回归预测,依据一个房子的全方位信息,包括面积、地段、环境等79个变量来预测出房子的价格。你的工作是预测每栋房子的销售价格。对于测试集中的每个Id,必须预测SalePrice变量的值。
这个比赛要求使用的metric
是Root-Mean-Squared-Error (RMSE) between the logarithm of the predicted value and the logarithm of the observed sales price
即观测到销售价格的对数与预测价格的对数之间的RMSE
提交文件的格式如下:
Id,SalePrice
1461,169000.1
1462,187724.1233
1463,175221
etc.
数据集介绍
一共有4个文件:train.csv
是训练文件,test.csv
是测试文件,data_description.txt
特征描述文件,sample_submission.csv
提交文件样例
train.csv文件字段含义:(英语水平有限,机翻的很多没那味)
SalePrice - 目标变量,销售价格