分子性质AI预测挑战赛
根据提供的demo数据集,可以基于demo数据集进行数据增强、自行搜集数据等方式扩充数据集,并自行划分数据。运用深度学习、强化学习或更加优秀人工智能的方法预测PROTACs的降解能力,若DC50>100nM且Dmax<80% ,则视为降解能力较差(demo数据集中Label=0);若DC50<=100nM或Dmax>=80%,则视为降解能力好(demo数据集中Label=1)。
1. 导入需要用到的相关库
2. 读取训练集和测试集
3 特征工程
3.1 test数据不包含 DC50 (nM) 和 Dmax (%),将train数据中的DC50 (nM) 和 Dmax (%)删除
3.2 将object类型的数据进行目标编码处理
4. 加载决策树模型进行训练
5. 保存结果文件到本地
小白刚刚跑通代码,持续学习中……