2021华为杯数学建模+C大数据题+抗乳腺癌药物+机器学习

2021华为杯数学建模C题

问题描述:

1.1问题背景
乳腺癌是每个女性的噩梦,至今为止,它是全球妇女高发的恶性肿瘤之一,也是我国女性最常见的恶性肿瘤。乳腺癌的发展与雌激素受体密切相关,通过调节雌激素受体活性来控制体内雌激素水平,Erα(雌激素受体α亚型)被认为是治疗乳腺癌的重要靶标,能够拮抗ERα活性的化合物可能是治疗乳腺癌的候选药物。
目前,在药物研发中,为了节约时间和成本,建立化合物活性预测模型是筛选潜在活性化合物的常用方法。具体做法是:针对乳腺癌的靶标ERα,收集作用于ERα的化合物及其生物活性数据,然后将分子结构描述符作为自变量,化合物的生物活性值作为因变量,构建化合物的定量结构-活性关系(QSAR)模型,有效地QSAR模型能够预测设计未测试活性化合物的生物活性,或者对已有活性化合物进行结构优化。
候选药物不仅要具备良好的抗乳腺癌活性,还需要具备良好的药代动力学性质和安全性,合称为ADMET性质,否则,即使化合物的活性再好,但其ADMET性质不佳,比如人体吸收困难,体内代谢速度太快,具有某种毒性,那也不能成为药物。因而在保证化合物生物活性的同时,还要对ADMET性质进行优化。
1.2问题重述
基于上述研究背景,根据附件提供的ERα拮抗剂信息(1974个化合物样本,每个样本都有729个分子描述符变量,1个生物活性数据,5个ADMET性质数据),构建化合物生物活性的定量预测模型和ADMET性质的分类预测模型,为同时优化ERα拮抗剂的生物活性和ADMET性质提供预测服务。主要分为以下四个问题:
问题一:根据文件“Molecular_Descriptor.xlsx”和“ERα_activity.xlsx”提供的数据,针对1974个化合物的729个分子描述符进行变量筛选,按照生物活性重要性从高到低排序,选出前20个对生物活性最具有显著影响的分子描述符(即变量),并详细说明分子描述符筛选过程及其合理性。
问题二:结合问题1,选择不超过20个分子描述符变量,构建化合物对ERα生物活性的定量预测模型。然后使用构建的模型,预测文件“ERα_activity.xlsx”test表中的50个化合物的IC50值以及pIC50值。
问题三:利用文件“Molecular_Descriptor.xlsx”提供的729个分子描述符,针对文件“ADMET.xlsx”中提供的1974个化合物的ADMET数据,分别构建ADMET五个指标的分类预测模型,根据构建的模型,对文件“ADMET.xlsx”test表中的50个化合物进行相应的预测,将结果填入“ADMET.xlsx”test表中对应的Caco-2、CYP3A4、hERG、HOB、MN列。
问题四:寻找最优范围的分子描述符,使化合物对抑制ERα具有更好的生物活性,同时具有更好的ADMET性质(给定的五个ADMET性质中,至少三个性质较好)。


摘要总览:

在这里插入图片描述
在这里插入图片描述
注释:第一问要求我们对高维数据进行降维,首先去除冗余0,去除相同的维度(相关系数约等于1)
第二问用多种机器学习方法去测试预测的准确度, 预测准确度高的是更合理的方法。
第三问做5次二分类操作,用多种机器学习方法测试找到没个分类最优的分类方法,
第四问用回归模型建立20各分子描述符与生物活性的关系,然后比较梯度上升发和Ada算法的优劣,计算出最优的值,计算分子描述符的取值范围

在这里插入图片描述
问题1 2 流程图
在这里插入图片描述
用两种方法都可以筛选出特征向量,通过预测准确性来挑选出一个最好的降维方法在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
从相关系数R^2来看,随机森林效果最佳,然后我们又通过K=10折交叉验证来选取最优模型
在这里插入图片描述
在这里插入图片描述
我们又使用网格搜索法来优化参数模型,最终得到没个分子描述符所对应的评价值。

对于问题三,我们首先分析2分类的一些方法
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


第四题队友做的,梯度上升算法不是很懂。 # 原因分析: 最后,分析只拿参与奖原因, 1.可能是由于我们第三题少放上答案了,缺少了评分依据。 2.横向比较得多,纵向比较得少,对于单个模型美国i有较为深入得研究 如又其他建议或或问题,大家可以评论区见
  • 2
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

sr_shirui

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值