准备文件 gtf/gff3全基因组fasta 背景知识 CDS=coding sequence,是编码区,是可翻译成蛋白质的exon的集合 cDNA比CDS多了5’-UTR和3’-UTR区域,是所有exon的集合 gene就是所有exon+intron的集合啦 提取CDS 提取genome 提取cDNA 就是提取所有的exon啦