【题目】2016年全国研究生数学建模竞赛B题 具有遗传性疾病和性状的遗传位点分析

该博客介绍了2016年全国研究生数学建模竞赛B题,涉及遗传性疾病和性状的遗传位点分析。通过全基因组方法确定致病位点或基因,对样本的疾病信息和位点编码进行对比分析,以揭示遗传病的遗传机理。问题包括位点编码转换、疾病关联位点、疾病相关基因及性状关联位点的寻找。
摘要由CSDN通过智能技术生成

同学给我看了她参加竞赛的题目,我一看,这不巧了吗,我也就看看题目......

人体的每条染色体携带一个DNA分子。在这条双螺旋的长链中,共有约30亿个碱基对,而基因则是DNA长链中有遗传效应的一些片段。在组成DNA的数量浩瀚的碱基对(或对应的脱氧核苷酸)中,有一些特定位置的单个核苷酸经常发生变异引起DNA的多态性,我们称之为位点

DNA长链中,位点个数约为碱基对个数的1/1000

近年来,研究人员大都采用全基因组的方法来确定致病位点或致病基因,具体做法是:招募大量志愿者(样本),包括具有某种遗传病的人和健康的人,通常用1表示病人,0表示健康者。对每个样本,采用碱基(A,T,C,G)的编码方式来获取每个位点的信息(因为染色体具有双螺旋结构,所以用两个碱基的组合表示一个位点的信息);如表1中,在位点rs100015位置,不同样本的编码都是T和C的组合,有三种不同编码方式TT,TCCC。类似地其他的位点虽然碱基的组合不同,但也只有三种不同编码。研究人员可以通过对样本的健康状况和位点编码的对比分析来确定致病位点,从而发现遗传病或性状的遗传机理。

 

这些信息包括这1000个样本的疾病信息、样本的9445个位点编码信息,以及包含这些位点的基因信息。

 

事实上,可以把基因理解为若干个位点组成的集合。

 

问题三、同上题中的样本患有遗传疾病A的信息(phenotype.txt文件)。现有300个基因,每个基因所包含的位点名称见文件夹gene_info中的300个dat文件,每个dat文件列出了对应基因所包含的位点(位点信息见文件genotype.dat)。由于可以把基因理解为若干个位点组成的集合,遗传疾病与基因的关联性可以由基因中包含的位点的全集或其子集合表现出来请找出与疾病最有可能相关的一个或几个基因,

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值