在Galaxy生信云平台,无需任何代码,即可从下机数据开始,分析得到转录组的表达量矩阵。
有了生物信息界的新物种,生信云。从此不需要购置服务器,不需要学习编程,生信小白也可以进行生物信息数据分析了。
工具地址
Galaxy中国(UseGalaxy.cn)> RNA ANALYSIS TOOLS > Standard Analysis > 有参转录组标准分析
功能描述
本工具用于转录组二代测序数据的标准分析,可生成表达量矩阵和测序数据质控结果。
这是一套非常流行的转录组定量分析流程,即 Hisat2 + Stringtie 经典组合,其步骤为:
fastp,进行质量控制,去除测序数据中不合格的序列,保留高质量序列用于后续分析;
hisat2,将经过质控得到的 Clean data,比对到参考基因组上;
samblaster,去除PCR或光学重复;
samtools,去除不合格的比对序列,将 SAM 文件转换成 BAM 文件;
stringtie,结合 hisat2 得到的比对文件(BAM)和基因组注释文件(GTF),进行定量分析,得到每个样本的表达量文件(FPKM / TPM);
prepDE.py,将 FPTM / TPM 转化为 Counts 计数的表达量矩阵,用于后续差异基因等分析。
操作步骤
1. 创建一个新的历史面板
在网站右侧的历史面板上方,点击 + 号,创建一个新的历史面板,可以为新面板取一个名字,如:Three Yeast Test。
2. 数据准备
2.1 共享数据的使用方法
如果使用测试数据,可以在网站上方菜单栏,找到:
数据共享 > 数据库 > RNA-seq > Three Yeast