《微信小程序进阶实战之分答应用开发（中级项目）》（完整版）

最新推荐文章于 2024-04-14 11:10:26 发布

很多时候不懂事、

最新推荐文章于 2024-04-14 11:10:26 发布

阅读量582

点赞数

本文链接：https://blog.csdn.net/tt15050/article/details/88550294

版权

本文介绍了Matrix eQTL工具，用于快速分析大规模eQTL数据，支持additive linear and ANOVA models。通过示例展示了如何设置参数、加载数据并进行分析，包括线性回归模型的选择和不同分析模型的解释。此外，还提供了模拟数据生成的代码，以帮助用户了解工具的使用流程。

摘要由CSDN通过智能技术生成

找到Matrix eQTL这个包，看下文章Matrix eQTL: ultra fast eQTL analysis via large matrix operations（https://doi.org/10.1093/bioinformatics/bts163
）
eQTL（表达数量性状位点）计算transcript-SNP 的关系，即分析SNP与基因的表达是否相关。由于计算数量巨大，很多人都用较小的数据来做。因此该作者开发了Matrix eQTL，用于处理大数据，支持additive linear and ANOVA models with covariates，并且可以将cis- and trans-eQTLs分开计算。
Matrix eQTL相较于其他软件如FastMap — 18.4 min, Merlin — 12.3 min, Plink — 9.0 min, Matrix eQTL — 5.7 min and snpMatrix — 3.3 min要快，它设置一个阈值，只有超过这个阈值的p值才会被计算。
采用的是线型回归模型，g为基因表达情况，s为SNP分型结果。

说明文档http://www.bios.unc.edu/research/genomic_software/Matrix_eQTL/runit.html
示例数据：http://www.bios.unc.edu/research/genomic_software/Matrix_eQTL/R.html
分析过程很简单，首先设置好要分析文件的路径和名称：

install.packages("MatrixEQTL")

# 设置数据目录，示例数据放在包的安装目录下了。
base.dir = find.package("MatrixEQTL")

#设置分析的模型
useModel = modelLINEAR; # modelANOVA or modelLINEAR or modelLINEAR_CROSS
#设置SNP文件的名称
SNP_file_name = paste(base.dir, "/data/SNP.txt", sep="");
# 设置表达数据文件的名称
expression_file_name = paste(base.dir, "/data/GE.txt", sep="");
# 设置协变量文件的名称
# 无协变量设置为character()
covariates_file_name = paste(base.dir, "/data/Covariates.txt", sep="");

output_file_name = tempfile();
提供了三种分析模型供选择
(1) modelLINEAR
Model: useModel = modelLINEAR
Equation: expression = α + ∑k βk⋅covariatek + γ⋅genotype_additive
Testing for significance of: γ
Test statistic: t-statistic
(2) modelANOVA

Model: useModel = modelANOVA
Equation: expression = α + ∑k βk⋅covariatek + γ1⋅genotype_additive + γ2⋅genotype_dominant
Testing for significance of: (γ1,γ2) pair
Test statistic: F-statistic
(3) modelLINEAR_CROSS

Model: useModel = modelLINEAR_CROSS
Equation:
expression = α + ∑k βk⋅covariatek + γ⋅genotype_additive + δ⋅genotype_additive⋅covariateK
Testing for significance of: δ
Test statistic: t-statistic
注意这里要设置一个p值的阈值，一般越大的数据量阈值设的越小，之前说过它会按这个阈值来计算结果，如果设的过大，分析耗时并且输出很多结果。输出的结果都储存在output_file_name里
pvOutputThreshold = 1e-2
# 设置协变量矩阵为 numeric()，很少用，默认
errorCovariance = numeric()
# 这里建立了一个SlicedData的新对象，用于存放martix的数据，并设置存放数据的格式
snps = SlicedData$new();

最低0.47元/天解锁文章

很多时候不懂事、

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
《微信小程序进阶实战之分答应用开发（中级项目）》（完整版）

找到Matrix eQTL这个包，看下文章Matrix eQTL: ultra fast eQTL analysis via large matrix operations（https://doi.org/10.1093/bioinformatics/bts163）eQTL（表达数量性状位点）计算transcript-SNP 的关系，即分析SNP与基因的表达是否相关。由于计算数量巨大，很多人都...
复制链接

扫一扫