刚接触这种比赛也没多久,大佬太多,主要是学习大佬的trick吧,拿奖是没想过了。
该baseline是本人自己写的,跟大佬的baseline没法比的。
特征基本上没有做,就清洗了下数据,模型采用的是最简单的线性回归模型。
目前线上成绩 0.17339
提升空间:做特征,换模型,做下融合。用深度学习应该也没问题。
比赛地址
完整代码
import pandas as pd
import numpy as np
import seaborn as sns
import warnings
import datetime
from sklearn.cross_validation import train_test_split
from sklearn.cross_validation import cross_val_score
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_absolute_error
warnings.filterwarnings("ignore")
data_train = pd.read_csv("input/train_feature.csv") #训练数据
data_train_y = pd.read_csv("input/train_label.csv") #训