- 数据挖掘第七周周报
- 1、本周工作 主要是和大家讨论交流以后,花时间去了解了baseline的方法和实现。看到lgboost和xgb和cat等方法,同时也了解了baseline的方法和特征工程和数据预处理以及模型调参
- 2、baseline的代码风格很好,把几个模型都集中在了一个函数里面,其中的库调用也让我受益很多。
def lgb_model(x_train, y_train, x_test):
lgb_train, lgb_test = cv_model(lgb, x_train, y_train, x_test, "lgb")
return lgb_train, lgb_test
def xgb_model(x_train, y_train, x_test):
xgb_train, xgb_test = cv_model(xgb, x_train, y_train, x_test, "xgb")
return xgb_train, xgb_test
def cat_model(x_train, y_train, x_test):
cat_train, cat_test = cv_model(CatBoostRegressor, x_train, y_train, x_test, "cat")
return cat_train, cat_test;
看了baseline之后才发现自己一直在踩坑,发现自己一直写的都是bug的感觉,看baseline的代码赏心悦目,感觉自己差距很大,希望自己好好加油。