RNA-seq——上游分析练习2(数据下载+trim-galore+hisat2+samtools+featureCounts)

这篇博客介绍了RNA-seq的上游分析实战,包括数据下载、trim-galore质控过滤、hisat2序列比对和featureCounts定量。通过fastq-dump或fasterq-dump处理sra数据,使用trim-galore进行质量控制,hisat2进行比对,最后用featureCounts进行基因定量。内容涉及MultiQC报告分析、比对结果的flagstat检查等。
摘要由CSDN通过智能技术生成

写在前面——本文是转录组上游分析的实战练习。主要包含四个步骤:

  1. 数据下载(包括sra数据、参考基因组、参考基因组注释文件)
  2. 质控过滤(使用trim-galore进行质控,使用fastqc、multiqc进行质量检测)
  3. 序列比对(hisat2)
  4. featureCounts定量

软件安装

详细步骤见
RNA-seq——一、Linux软件安装

安装配置conda

wget -c https://mirrors.bfsu.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh
source ~/.bashrc

conda config --add channels r
conda config --add channels bioconda
conda config --add channels conda-forge
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/cloud/bioconda/
conda config --set show_channel_urls yes

使用conda安装软件

conda create -n rna python=3.8
conda activate rna

conda install fastqc
conda install multiqc
conda install trim-galore
conda install hisat2
conda install samtools
conda install subread

新建文件夹

00ref:存放参考基因组及注释文件
01raw_data:存放原始数据
02clean_data:存放清洗之后的数据
03align_data:存放比对后的文件
04matrix:存放reads计数文件

文件结构清晰,让人赏心悦目~

注:练习时注意当前所在位置,要在正确的文件夹中进行正确的操作。

一、下载数据

conda install sra-tools
conda update sra-tools

# -p  Show progress
prefetch 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值