1、首先上github链接
2、解释说明:这个包是A package for including transposable elements in differential enrichment analysis of sequencing datasets.
可以用于RNA-seq的TE差异分析
3、下载安装
git clone https://github.com/mhammell-laboratory/TEtranscripts
cd TEtranscripts python
setup.py install --user
4、准备文件
treatment组的bam文件(bam最好通过star比对完)
control组的bam文件
gene的GTF注释
TE的GTF注释
GTF可以到网站下载Software - Hammell Lab
Index of /shares/mhammelllab/www-data/TEtranscripts/TE_GTF
5、代码
TEtranscripts --mode multi \
-t ./treatment1.bam ./treatment2.bam \
-c ./control1.bam ./control2.bam \
--GTF ./genome_reference/human/gene/gencode.v36.annotation.gtf \
--TE ./genome_reference/human/TF/hg38_rmsk_TE.gtf \
--project TEtranscripts_out
# --sortByPos 如果bam文件sorted 需要加入这个参数
#--mode 默认是multi
#-t 处理组的bam文件
#-c control组的bam文件
#--GTF genic-GTF-file 基因组注释GTF
#--TE TE-GTF-file TE注释的GTF
#--project 输出文件output files目录的名字 默认是TEtranscripts_out