欢迎关注”生信修炼手册”!
GTEx全称如下
Genotype-Tissue Expression
该项目对来自人体多个组合和器官的样本,同时进行了转录组测序和基因分型分析,构建了一个组织特异性的基因表达和调控的数据库。网址如下
https://gtexportal.org/home/
包含的组织类型和样本个数如下图所示
对于所有的样本,主要进行了以下三种分析
1. RNA seq
通过illumina Truseq试剂盒构建polyA+文库,采用Hiseq 2000/2500进行测序,对于下机数据,采用STAR进行比对,参照选择的是gencode V19版本的gtf文件,进行了以下3个level的定量
gene-level,采用RNAseQC软件,对基因的raw count和TPM两种方式进行定量
exon-level, 对exon的raw count进行定量
transcript-level,采用RSEM进行转录本水平的定量
2. genotype
通过WGS对样本进行分型, 采用的是GATK germline variants calling的流程,步骤如下
bwa-mem alignment
picard markduplicate