表观遗传关联研究软件应用
实验课练习EWAS
甲基化位点在每个人中的表达水平不同,在疾病、正常样本中寻找甲基化位点显著性差异,进而评估疾病进行寻找甲基化位点(marker)。
基于β值的关联分析
C:
cd C:\Users\temp\Desktop\生信案例分析
java -jar ewas_20210603.jar
t.test T检验
输入数据文件格式
芯片数据,甲基化信号。β值=(甲基化信号)/(甲基化信号+非甲基化信号+背景信号)
背景信号默认为100.
首行:title和样本标签
(Normal:1;case:2)
第二行之后
第一列:甲基化位点名称
第二列:所在染色体号
第三列:染色体上物理位置
第四列及之后:甲基化表达值
java -jar ewas_20210603.jar -t.test -input GSE65163_anno.txt -out ewasttest.txt
输出结果文件
第一列:甲基化位点名称
第二列:所在染色体号
第三列:染色体上物理位置:
Case_valid_size:可用的case数(删去了不符合标准的样本数据)
control_valid_size:可用的control数
case、control的均值、FC值、T值、p值(<0.05)
linear 线性回归分析
java -jar ewas_20210603.jar -linear -input GSE65163_linear.txt -output lineas_GSE65163.txt -unsort
logistic 逻辑回归 -formula phenotype~(波浪号)marker
#根据疾病-位点进行逻辑回归
java -jar ewas_20210603.jar -logistic -formula disease_state~marker -input GSE65163_logistic.txt -output logistic_GSE65163.txt -unsort
Y=ax+b
coefficient.Intercept 截距 SE.Intercept Zvalue.Intercept Pvalue.Intercept coefficient.marker SE.marker Zvalue.marker Pvalue.marker
#根据性别-位点进行逻辑回归
java -jar ewas_20210603.jar -logistic -formula gender~marker -input GSE65163_logistic.txt -output logistic_gender_GSE65163.txt -unsort
#根据疾病状态—性别&位点进行逻辑回归 二元logistic
java -jar ewas_20210603.jar -logistic -formula disease_state~marker+gender -input GSE65163_logistic.txt -output logisticMG_GSE65163.txt -unsort
ID_REF sampleSize validSampleSize coefficient.Intercept SE.Intercept Zvalue.Intercept Pvalue.Intercept coefficient.marker SE.marker Zvalue.marker Pvalue.marker coefficient.gender SE.gender Zvalue.gender Pvalue.gender
基于β值的关联分析基于β基于β值的关联分析于β值的关联分析基于β值的关联分析基于β值的关联分析