Luminosite Eternelle-CSDN博客

原创利用 edgeR 分析 RNAseq 数据

设置工作目录,xxx 为表达矩阵数据目录。1.1读取featureCounts表达矩阵。

2024-03-23 22:29:00 1272

左图为HTseq计算的结果，右图为featureCounts计算结果，两种计算结果是一样的，但featureCounts可以运算多个bam文件，速度更快，且可以形成表达矩阵。总结来说，这个命令将对指定的BAM文件集合进行读取计数，每条读取都会根据其覆盖的基因ID进行分组，并将结果输出到一个CSV文件中。FeatureCounts将读取这些文件中的比对数据，并根据注释文件中的信息计算每个基因的读取计数。: 指定提供的注释文件的格式，可接受的格式包括'GTF'（或兼容的GFF格式）和'SAF'。

2024-03-23 21:10:46 7514 1

原创 fastq文件预处理（fastp和multiqc）

multiqc ..代表在当前文件夹生成报告--outdir(-o): 在指定的输出目录中创建报告。--title(-i): 报告标题。作为页面页眉打印，如果没有特别指定，则用于文件名。

2024-03-23 14:14:35 4183

原创 RNA-seq差异表达分析绘图（MA图、火山图）

这个参数设置了y轴的界限，即对数变化值的范围。在这个例子中，y轴的范围被限制在-10到10之间。这通常用于放大图中的某些区域，使得变化较大的基因更容易观察。

2024-03-21 23:25:43 4661

原创 R上差异表达分析（准备、整合、过滤、样本离群值可视化分析）

定义文件编号# 格式化文件编号为2位数字符串# 生成完整的样本编号# 定义一个函数来读取和处理每个样本文件# 使用lapply读取所有样本文件，结果存储在一个列表中# 检查所有样本文件是否具有相同的行数if (!# 使用do.call和cbind将列表中的所有数据框按列合并，coun_table可以替换自己想输出的名字# 设置合并后的数据框的列名为样本编号。

2024-03-17 21:39:07 2412

原创 Linux下载jdk17

输入tar -zxvf jdk-17.0.10_linux-x64_bin.tar.gz 解压，会看到一个jdk-17.0.10目录，这就是jdk17的安装目录。在文件的末尾加上两行，将/home/lumino/tool/jdk-17.0.10 替换为bin文件所在路径。ubuntu虚拟机复制带linux-x64.tar.gz的，输入以下代码。进入jdk下载网站获得最新jdk17下载地址。保存并关闭文件（ctrl-o后ctrl-x）输入 java -version确认是否激活。编辑shell配置文件。

2024-03-16 00:06:18 4475

原创 Linux的RNA-seq分析（stringtie-FPKM和HTseq计数）

确保安装了stringtie如果要研究新的转录本，则需要完成所有样本的转录本的组装并整合在stingtie-merged.gtf中，详细见Linux系统RNA-seq分析（stringtie转录本组装)。新建SRR3418005_FPKM子文件夹，并在其中打开终端：这个选项告诉stringtie不仅要输出组装得到的转录本，还要输出那些表达量较低、可能不被认为是完整转录本的“额外”转录本片段。这有助于捕获那些可能只部分被测序覆盖的转录本区域。-p 2：这个选项指定了stringtie。

2024-03-15 21:19:56 3346

原创 Linux系统RNA-seq分析（stringtie转录本组装)

Stringtie对于转录本组装和后续转录本丰度定量。

2024-03-14 01:00:19 2075

原创 RNA-seq数据分析（分析策略，比对，转录组组装，转录本定量）

分析策略通过综合分析RNA-seq分析流程中不同步骤的工具性能发现不同的分析工具和方法对分析结果的准确度和分析时间影响巨大。HISAT2表现出最快的速度和最准确的拼接比对，但是没有STAR的敏感度高。StringTie在速度和准确度上都优于Cufflinks。长读段方法如IDP和Iso-Seq会识别许多短读段技术没有识别到的多外显子转录本，但是会丢失一些单外显子转录本。通常，在从头组装工具中，Oases表现最佳。不经过比对的工具如和kallisto。

2024-03-13 21:48:54 7142

原创 Linux系统下RNA-seq分析（利用bowtie2比对）

3.bowtie2-build 是用来建立索引的命令，/home/lumino/TEST1/TEST1.1/tair10.fa 是你的基因组 FASTA 文件的路径，tair10 是你希望为索引文件使用的前缀。综上所述，从提供的数据来看，这些数据的质量在映射率和读取长度方面看起来是合理的，但还需要进一步的质量控制分析来确认其完整的质量状况。: 没有次级对齐的 reads，这通常表示数据中的 reads 都是唯一的，没有来自重复区域或高度相似区域的 reads。则指定了输出SAM格式文件的路径和名称。

2024-03-12 01:28:30 2162

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

weixin_43927366的博客

原创利用 edgeR 分析 RNAseq 数据

原创 Featurecounts计数

原创 fastq文件预处理（fastp和multiqc）

原创 RNA-seq差异表达分析绘图（MA图、火山图）

原创 R上差异表达分析（准备、整合、过滤、样本离群值可视化分析）

原创 Linux下载jdk17

原创 Linux的RNA-seq分析（stringtie-FPKM和HTseq计数）

原创 Linux系统RNA-seq分析（stringtie转录本组装)

原创 RNA-seq数据分析（分析策略，比对，转录组组装，转录本定量）

原创 Linux系统下RNA-seq分析（利用bowtie2比对）

原创 Conda下载生物信息学工具

原创 Linux系统下RNA-seq分析（2.STAR比对和cufflinks拼接）

原创 Linux系统进行RNA-seq分析（数据预处理）

原创使用GALAXY进行RNA-seq数据分析（1）数据预处理

整合不同样本reads计数到同一txt

空空如也