提取线粒体基因组
Trinity安装与报错
(仅作为学习的记录,以下命令是小伙伴儿整理给我用的)
#寻找近缘种建立参考基因组(这里的ref要自己创建,将参考基因组下载至文件夹中)
$ hisat2-build ./ref/genome.fasta ./ref/genome 1>hisat2-build.log 2>&1
#Hisat2进行比对,使用构建好的参考基因组与转录组双末端测序数据得到sam文件(-1和-2指原始测序数据,双末端测序raw_data就会有两个数据)
$ hisat2 -t -p 4 -x ./ref/genome -1 ./ga_1seq/ga_1.R1.fq.gz -2 ./ga_1seq/ga_1.R2.fq.gz -S ga1.sam 1>ga1.log 2>&1
#文件格式转换
$ samtools sort -o ga_1.bam ga1.sam
#提取比对上的reads
$ samtools view -bF 4 ga_1.bam> ga_1.F.bam
#将比对上的bamreads转化为fasta文件
bamToFastq -i ga_1.F.bam -fq ga_1.F.fastq
#使用Trinity拼接
Trinity --seqType fq --max_memory 30G --single ga_1.F.fastq --CPU 6 1>ga1trinity.log 2>&1
#拼接过程遇到很多问题,最严重的就是“格式不标准、不识别”的问题
Error, /software/trinityrnaseq-v2.13.2/util/insilico_read_normalization.pl line 795.
因此,我对拼接命令做了更改
$ ~/software/trin