2016深圳杯D题 思路

离2016年深圳杯比赛已经过去半年多了,当时我们获得了国家二等奖,楼主对具体思路也记得不大清了。简单说一下当时的思路吧。

题目不再赘述。。。

本题神坑。

第一问,构建人体动态量化模型,完全不会。。。当时去答辩的十几支队都在瞎扯。

本身数据没有给出,本来说好的六组数据,出题人为了简化一下,只给了一组数据,能给出模型的不是在扯我都不信。

假如说,给出了六组数据,那我们可以构建一个贝叶斯网络或者神经网络等等网络模型,具体连接关系需要强大的生物组学知识。所以说根本给不出来,针对某一特定代谢过程还好说。

第二三问。寻找致病通路,我们直接是去寻找致病基因,并根据一个生物学软件找出这个致病基因的代谢过程,我们认为这个代谢通路中就存在致病通路。对于未知患病情况的人进行预测,我们就利用KNN的思想,寻找与样本中最相似的N个样本,利用投票法给出患病类型及程度。

问题的核心寻找致病基因,这种问题明显是没法用拟合来做,样本数量远远小于未知数个数,神经网络、线性拟合等等都是扯淡,主流的方法大都是统计学方法。我们把致病基因的筛选过程看做一个特征选择的过程,特征选择之前要对数据进行预处理,包括归一化、数据清洗等等,最重要的是要进行一个聚类操作,这是因为题目数据给出的分组严重干扰了我们的接下来的特征选择。分别用包裹式和过滤式两种,并进行结果验证。最终的结果验证是通过基于文献挖掘的原理,即我们所筛选出的基因在文献挖掘出的基因中占比。

具体问题的解决是一个漫长的过程。楼主前前后后思考了近一个月,也没有给出合适的思路。毕竟这是一个前沿问题。能解决就奇了怪了。

奉劝各位要参加深圳杯的同学一句:坚持就是胜利!一定要坚持做下去,去参加的人没有想象中的那么厉害。答辩的时候能镇住全场就行了,尽量不要让人家挑出错来。

时间过去太久了,好多细节都忘了,各路大神如果有什么建议,欢迎提出!

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值