kaggle 酶稳定性预测 前排的高分baseline
大家好,我是kim!这里主要是我在kaggle学习的一些感兴趣内容,希望能和大家一起分享下,一起学习一起进步!之前玩过国内的一些数据科学的比赛,跌跌跄跄偶尔运气爆棚能打个低保,但国内的比赛氛围好像不太好,感觉进步很小,所以想转战kaggle和各路大佬们学习一波,修炼一年后再回去,希望能坚持下去!
通用比赛的一些名词:
CV:cross validation(线下分数)
LB:leader board(线上分数)
简介
本次比赛的一些名词:
tm:thermostability
这里主要是针对lgbm等树模型和nn等深度模型的前排baseline思路,仅供大家参考!
Data
主要是预测单氨基酸突变和缺失后蛋白质热稳定性(tm)的排名
数据使用:https://www.kaggle.com/competitions/novozymes-enzyme-stability-prediction/discussion/358320