越来越多的用户使用我们的云上转录组流程,我们也应用户的要求不断地对流程进行更新和优化,如增加特殊的参考基因组等。
本次更新亮点:
提供BAM文件下载。
现在,转录组流程会输出3组文件:
Expression Counting,包含质控以及表达量矩阵的打包文件。
List of Pairs,样本信息。
BAM files,比对到参考基因组的 BAM 文件。
之前为何不提供 BAM 文件的下载?因为 BAM 通常比较大,下载会占用服务器较大的带宽。但是有些用户又确实需要 BAM 文件,因此我们本次更新还是提供了下载选择。希望大家确实需要时才下载 BAM,合理利用服务器资源。
众所周知,我们云上转录组流程整合了一组非常流行的工具,核心是 Hisat2 + Stringtie,其步骤为:
fastp,进行质量控制,去除测序数据中不合格的序列,保留高质量序列用于后续分析;
hisat2,将经过质控得到的 Clean data,比对到参考基因组上;
samblaster,去除PCR或光学重复;
samtools,去除不合格的比对序列,将 SAM 文件转换成 BAM 文件;
stringtie,结合 hisat2 得到的比对文件(BAM)和基因组注释文件(GTF),进行定量分析,得到每个样本的表达量文件(FPKM / TPM);
prepDE.py,将 FPTM / TPM 转化为 Counts 计数的表达量矩阵,用于后续差异基因等分析。
欢迎大家使用。
关于简说基因
生信平台
Galaxy中国(UseGalaxy.cn)致力于打造中国人的云上生物信息基础设施。大量在线工具免费使用。无需安装,用完即走。活跃的用户社区,随时交流使用心得。
生信培训
简说基因的生信培训班,荣获学员的一致好评。如果你也对生物信息学感兴趣,欢迎来跟简说基因,学真生信。
生信分析
我们能够承接所有 NGS 组学数据分析业务,包括但不限于 WGS / WES / RNA-seq 等。基因组组装、注释,以及各种重测序业务都可以与简说基因合作。