文献:RibORF: Identifying genome-wide translated open reading frames using ribosome profiling
是按照这个文献 的方法进行分析的过程,如果在步骤中有什么不能运行,可以看文献作者的git hub:https://github.com/zhejilab/RibORF
1.软件及数据下载
- 软件
使用conda进行下载
star hisat2 Perl fastqc gtfToGenePred bowtie
- Download RibORF software
在这个网站里面下载脚本:https://github.com/zhejilab/RibORF/.
“ORFannotate.pl”,
“removeAdapter.pl”,
“readDist.pl”,
“offsetCorrect.pl”
“ribORF.pl”.
- 从GENCODE下载基因组数据
wget ftp://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_human/release_28/gencode.v28.annotation.gtf.gz
wget ftp://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_human/release_28/GRCh38.primary_assembly.genome.fa.gz
2.把GTF文件转化成GenePred
gtfToGenePred gencode.v28.annotation.gtf gencode.v28.annotation.genePred.txt
3.运行“ORFannotate.pl”并生成genePred格式的候选ORF。
mkdir outputDir
perl ORFannotate.pl -g GRCh38.primary_assembly.genome.fa -t
gencode.v28.annotation.genePred.txt -o outputDir
得到的两个文件如下
-rw-r--r-- 1 med-zhouh med-chenh 11G Jul 15 00:53 candidateORF.fa
-rw-r--r-- 1 med-zhouh med-chenh 10G Jul 15 00:53 candidateORF.genepred.txt
打开之后是这样:
(riboseq) [xx@login01 outputDir]$ head candidateORF.fa
>ENST00000456328.2:chr1:+|1|1657:7:67|noncoding|TTG
TTGCCGTCAGCCTTTTCTTTGACCTCTTCTTTCTGTTCATGTGTATTTGCTGTCTCTTAG
>ENST00000456328.2:chr1:+|2|1657:25:67|noncoding|TTG
TTGACCTCTTCTTTCTGTTCATGTGTATTTGCTGTCTCTTAG
>ENST00000456328.2:chr1:+|3|1657:39:150|noncoding|CTG
CTGTTCATGTGTATTTGCTGTCTCTTAGCCCAGACTTCCCGTGTCCTTTCCACCGGGCCTTTGAGAGGTCACAGGGTCTTGATGCTGTGGTCTTCATCTGCAGGTGTCTGA
>ENST00000456328.2:chr1:+|4|1657:45:150|