RNA-seq——二、sra数据下载、fastqc与质量控制

最新推荐文章于 2024-04-04 19:52:24 发布

Dzfly..

最新推荐文章于 2024-04-04 19:52:24 发布

阅读量1.9k

点赞数 1

分类专栏：生信学习文章标签： RNA-seq fastqc multiqc trim_galore sra数据下载

本文链接：https://blog.csdn.net/narutodzx/article/details/126451033

版权

本文介绍了RNA-seq数据的sra下载和质量检测，包括fastqc的Per tile sequence quality、Per base sequence content和Sequence Duplication Levels分析，以及multiqc的综合展示。内容涵盖fastq-dump参数解析，质量控制标准和处理后的效果评估。

摘要由CSDN通过智能技术生成

一、sra数据下载

关于sra数据下载方法可以参考之前的文章：RNA-seq——快速下载SRA数据

在Linux中下载方法如下：

# 下载所需数据
for ((i=77;i<=80;i++)) ;do prefetch -v SRR9576$i; done

# 找到自己的数据存放位置，解压文件
for((i=79;i<=80;i++));do fastq-dump --gzip --

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Dzfly..

关注关注

1
点赞
踩
28

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

RNA-seq分析：Step3（数据预处理）

沉香best的博客

08-21

2871

RNA-seq是一种高通量基因表达分析技术，常用于研究生物体内基因表达的变化。在进行RNA-seq之前，需要进行预处理工作以优化实验结果。预处理包括：1）样本质量控制，包括检验RNA完整性和纯度；2）RNA文库制备，包括选择RNA样本、RNA转录成cDNA、文库构建等；3）测序平台选择，包括Illumina、IonTorrent等；4）数据质量控制，包括去除低质量序列、去除接头序列、过滤低复杂度序列等；5）比对和定量，包括将测序序列映射到参考基因组、计算基因表达量等。预处理的好坏直接影响后续分析结果的可靠性

文件过滤_hisat2比对小不同：fastp过滤后和trim_galore过滤后文件

weixin_36439481的博客

01-13

1098

trim_galore过滤后的文件名：SRR10428360_1_val_1.fq.gzSRR10428360_2_val_2.fq.gzindex=/home/data/vip30/database/genome/Ensembl/Homo_sapiens/Homo_sapiens.GRCh38_release101.genomeinputdir=/home/data/vip30/dat...

参与评论您还未登录，请先登录后发表或查看评论

Fastqc0.11.2

01-11

Fastqc0.11.2软件，本软件在Windows系统下操作运行，使用本软件检测第二段测序结果的质量。

单细胞RNA测序（scRNA-seq）SRA数据下载及fastq-dumq数据拆分

最新发布

LittleComputerRobot的博客

04-04

2426

SRA数据下载及fastq-dumq数据拆分

RNA-seq数据分析（分析策略，比对，转录组组装，转录本定量）

weixin_43927366的博客

03-13

4281

分析策略通过综合分析RNA-seq分析流程中不同步骤的工具性能发现不同的分析工具和方法对分析结果的准确度和分析时间影响巨大。HISAT2表现出最快的速度和最准确的拼接比对，但是没有STAR的敏感度高。StringTie在速度和准确度上都优于Cufflinks。长读段方法如IDP和Iso-Seq会识别许多短读段技术没有识别到的多外显子转录本，但是会丢失一些单外显子转录本。通常，在从头组装工具中，Oases表现最佳。不经过比对的工具如和kallisto。

【双端测序有参转录组数据上游完整软件代码、参数及输出结果】

weixin_56701701的博客

12-13

1441

qc为输入文件夹 -o输出指令，multiqc为输出文件夹名称，-n zz为生成报告的前缀名称。*fq.gz是文件后缀名，-o输出指令，qc为输出文件夹名称 -t为线程数。在进行代码之前，确保软件安装，环境和目录都是对的情况下。fastqc和multiqc软件。fastqc和multiqc软件。

RNA-seq——学习路线、学习经验、实战项目、学习总结

Dzfly

09-12

1301

转录组分析的学习路线、实战项目、学习经验、学习总结。

Bulk-RNA-seq流程——从测序数据到count文件(AGSdata)

weixin_63884580的博客

02-11

8852

RNA-seq通用流程（从原始测序数据到count文件）：环境安装，软件安装，数据质控，数据过滤，序列比对，bam文件，count

RNA-seq——上游分析练习2（数据下载+trim-galore+hisat2+samtools+featureCounts）

Dzfly

12-18

4307

本文是转录组上游分析的实战练习。

fsQCA_fsqca_processing_

09-30

QCA is very useful in processing 01 data

RNA-seq(2):下载参考基因组及基因注释，及测序数据-学习笔记

leo12354的博客

05-05

4795

今天学习了如题的一些操作。但是并不算成功。本来打算做到quality control，结果卡在了下载测序数据上，硬生生地卡在这儿。参考网站：（RNA-seq(4):下载参考基因组及基因注释） 1.安装ASPERA 1）wget http://download.asperasoft.com/download/sw/connect/3.7.4/aspera-connect-3.7.4.147727...

fastq质量值_fastq数据质量控制(质控)(QC)简单说明

weixin_39601929的博客

01-17

519

最近终于进行实习了，我的第一个工作其实非常的简单，就是先去试试各种工具。当我们拿到一个fastq数据，我们当然是要进行质量控制。不清楚这些数据能不能给po到网络上以防万一，我先不直接po我的数据图了。我们拿到的数据，通常都是fastq文件格式，无论是当前占有率最高的二代测序还是最有发展前途的三代测序，都是生成fastq数据。fastq数据的格式也是非常简单，每四行表示一个测序结果(read)第一行...

NGS数据分析实践：05. 测序数据的基本质控 [1] - FastQC

hucy_Bioinfo

10-01

8738

一般我们可以从如下几个方面来分析测序数据质量： read各个位置的碱基质量值分布 (Per base sequence quality) 碱基的总体质量值分布 (Per sequence quality scores) read各个位置上碱基分布比例 (Per base sequence content) GC含量分布 (Per sequence GC content) read各位置的N含量 (Per base N content) read是否还包含测序的接头序列 (Adapter Content)

用FastQC检查高通量测序原始数据的质量

abj72521的博客

12-26

1528

本篇文章，主要参考了阳光1986的博文（http://www.dxy.cn/bbs/topic/31324367），自己测序的分析结果作为对比，加在其中了。 1.简介当二代测序的原始数据拿到手之后，第一步要做的就是看一看原始reads的质量。常用的工具就是fastqc (http://www.bioinformatics.babraham.ac.uk/projects/fas...

文献RNA-seq复现第2期——sra数据转换、参考基因组及注释信息的准备

qq_53971833的博客

08-25

2565

sra数据转换、参考基因组及注释信息的准备

RNA-seq流程学习笔记（4）-使用FastQC软件对fastq格式的数据进行质量控制