linux分析rna-seq,RNA-seq 分析流程(一)linux部分

本文详细介绍了在Linux系统中进行RNA-seq数据分析的全过程,包括软件安装、原始数据校验、数据质控与矫正、比对(hisat2和STAR)以及转换和统计分析,如使用featureCounts计算基因表达量。内容涵盖了从fastqc到multiqc的质控工具,再到比对和归一化等关键步骤。
摘要由CSDN通过智能技术生成

Step1:软件安装

数据资源下载,参考基因组及参考转录组(linux)

gtf ,genome,fa

质控,需要fastqc及multiqc(linux)

trimmomatic,cutadapt,trim-galore

对比(linux)

star,HISAT2,TOPHAT2, bowtie,bwa,subread

计数(linux)

featureCounts,htseq-counts,bedtools

nomalization 归一化,差异分析等(R 包)

DEseq2,edgeR,limma

注,fastqc和trim-galore需要下载openjdk,非常大,建议使用conda install --offline /home/xxx/src/openjdk-11.0.1-h516909a_1016.tar.bz2 线下安装

conda install -y fastqc trim-galore star bwa hisat2 bowtie2 subread tophat htseq bedtools deeptools salmon cutadapt multiqc sra-tools

conda install -c bioconda trimmomatic

Step2:原始数据校验

md5sum -c cdmd5.txt

Step3: 数据质控与矫正

3.1. fastqc

fastqc 批处理并将结果保存在qc文件夹下

fastqc -o ./qc/ *.fq.gz

multiqc整合fastqc结果

multiqc -o .

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值