生信软件的下载与使用方法总结

  • 一般都可以通过 conda install 安装,如果不行,再考虑其他方法

质控

FastQC

#安装
#从conda直接安装
conda isntall fastqc
#如果实在没办法,方法二,从官网下载
wget https://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.11.9.zip
unzip fastqc*.zip -d .
cd FastQC
chmod 755 fastqc
fastqc -h

#使用
fastqc [-o output dir] [-f fastq|bam|sam] [-t threads] seqfile1 seqfile2 ... seqfileN

FastQC下载地址

Multiqc

#安装
conda install -c bioconda -c conda-forge multiqc

#使用
multiqc .

比对

STAR

#安装
conda insall STAR
which STAR #看一下安装成功了没

#使用
#先建立索引
STAR --runThreadN 4 --runMode genomeGenerate --genomeDir . --genomeFastaFiles GRCh38.fa --sjdbGTFfile GRCh38.gtf
#对GRCh38建立索引,约需内存32G,4线程下约需要1.5h

#比对
STAR --runMode alignReads --runThreadN 4 --readFilesIn seq_1.fastq.gz seq_2.fastq.gz --outFileNamePrefix ../alignment_result/ID. --genomeDir ../ref --readFilesCommand zcat
#3514个单细胞,10线程36小时,内存约32G

Samtools

#安装
conda install -c bioconda samtools

#.sam转换成.bam
samtools view -@ 10 -S SRR0011223344.sam -b > SRR0011223344.bam

#.bam排序,默认按照染色体位置
samtools sort SRR0011223344.bam -o SRR0011223344.sorted.bam

#索引
samtools index SRR0011223344.sorted.bam

报错踩坑

Parse Error
Truncated File.

  • 文件里混入了一些莫名其妙的东西,有可能是Standard error 和 Stardard output 的问题。应该检查一下具体的代码时怎么跑的,pipeline是怎么样的,比较直接的办法就是不要贪图简便,把转换和sort的步骤分开跑。

生成表达矩阵

FeatureCounts

#安装
wget -c https://sourceforge.net/projects/subread/files/subread-2.0.0/subread-2.0.0-Linux-x86_64.tar.gz
tar -zxvf subread-2.0.0-Linux-x86_64.tar.gz 
#统计conts
../app/subread-2.0.0-Linux-x86_64/bin/featureCounts -T 6 -t exon -g gene_id -a ../ref/GRCh38_ERCC.gtf -o CountsRaw.txt  *.sorted.bam 1>FeatureCounts.log 2>&1 

  • 1
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值