华为杯D题思路
D 抗乳腺癌候选药物的优化建模(数模孵化园)这道题就是分类问题,解决的方法基本都是机器学习(含深度学习、强化学习)的方法,来看第一问第一问,ERα_activity中一般采用pIC50来表示生物活性值,看这一列就好,Molecular_Descriptor有729个指标,给出关联程度前Top20,数据都是实验数据,数据要不要标准化处理,如果要处理那么后文都得用这个标准化处理后的数据,要么就不处理,标准化处理后会改变算法的结果,算各指标的关联性直接加个循环依次求每个指标与pIC50的相关性即可,SMILES
复制链接