数模-化验结果判别及matlab程序,数模化验结果判别及matlab程序.pdf

地贫患者的基因筛查问题

摘 要

地中海贫血(简称“地贫”)是全球广为流行、危害极为严重的遗传性溶血性疾病,全世界至少

有 3.45 亿人携带地中海贫血的致病基因。医学上通过大人群的基因筛查来预防地贫患儿的出生。

本文应用统计学原理,对病人以及健康人的 110 个基因进行分析,采用 Fisher 判别模型

建立判别标准和多元统计模型 spss 软件进行筛选。

问题一,利用费希尔模型判别待测者是否患有地贫,以编号 1~20 地贫患者的样本,编号

21~40 健康人员的样本,分别作为模版建立模型,用 mathlab 软件求解得到待测组的患病者编号 41~60

个是待筛查人员的样本。

问题二,为确定“地贫”样本与“健康”样本在基因链上的区别。以及癌症样本中是否有子类。

我们用 1~20 数据为标准化并确立相关系数矩阵,求出相关矩阵的特征值和特征向量,然后通过前 m

i i

(   ) /(   )  85%

个主成 分的累计贡献率满足 k 1 k k 1 k 来确定贡献率矩阵,从而得出各种基因的

权值,又利用初始特征值需大于 1 ,再运用逐步剔除法得出关键基因

关键字:地贫患者的基因 Fisher 判别 筛查 相关系数矩阵

1 问题重述

化验指标能够协助医生诊断。人们到医院就诊时,诊断就诊人员是否患肾炎时通常

要化验人体内各种元素含量。表 B.1 是确诊病例的化验结果,其中 1-30 号病例是已经

确诊为肾炎病人的化验结果;31 -60 号病例是已经确定为健康人的结果。表 B.2 是就诊

人员的化验结果。

1. 根据表 B.1 中的数据,提出一种或多种简便的判别方法,判别属于患者或健康人

的方法,并检验你提出方法的正确性。

2. 按照 1 提出的方法,判断表 B.2 中的30 名就诊人员的化验结果进行判别,判定他

(她)们是肾炎病人还是健康人。

3. 能否根据表 B.1 的数据特征,确定哪些指标是影响人们患肾炎的关键或主要因素,

以便减少化验的指标。

4. 根据 3 的结果,重复2 的工作。

5. 对 2 和 4 的结果作进一步的分析。

2 问题分析

问题解决的关键是如何正确判断正常人与患者之间的差异,利用所给数据,可以选

[1] [2]

择用医学统计方法 中的判别分析法 进行分析。从题目给出的表中可以得出以下信息:

1) 表中分别给出正常人与患者各 30 组数据,每组数据各包含 7 种元素(Zn 、Cu、

Fe 、Ca、Mg 、K 、Na )在人体中的含量。通过对这些数据进行分析,可以从中找出数据

差异,根据判别法确定判别标准。利用所得判别标准,与就诊人员的化验结果比较可以

判别其是否患有肾炎;

2 ) 采用某医院化验的 30 名健康人和 30 名肾炎患者体内的 7 种微量元素的含量作

为基础数据,从中选取 20 名健康人和 20 名肾炎患者的数据作为样本,进行采样分析,

建立判定模型,并利用剩余的 10 名健康人和 10 名患者对判定模型进行正确率检验,

即可得到判定模型的正确率。

3 ) 利用不同的判别法,用 Matlab 软件编程对数据进行处理,得到相应判别标准。

将就诊人员数据与判别值比较,即可对就诊人员是否患病做出明确判断。这样就解决了

第二问;

4 ) 在第一问基础上利用 EXCEL 将各元素比重进行作图分析,即可直观地确定各种

元素的权重,从而筛选出关键因素。这样就解决了第三问;

- 1 -

5 ) 在第四问中将第三问得出的关键元素对应的数据的在判别程序中保留,其余元

素的数据删除。再利用 Matlab 软件对就诊人员数据进行处理,判断其是否患病。

6 ) 在第五问中,将第二问与第四问所

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值