![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
RNA-seq学习笔记
文章平均质量分 68
垚垚爸爱学习
高校青椒,奶爸一枚,中年转行,生信老白,从零学起。
展开
-
RNA-seq流程学习笔记(18)- Heatmap图
利用R包进行heatmap绘图,包括基因集的提取、格式转换,FPKM值提取、保存,热图的绘制等原创 2022-11-27 09:31:38 · 1807 阅读 · 1 评论 -
RNA-seq流程学习笔记(5)-Linux系统下载UCSC人类基因组和基因注释文件(未完成)
主要参考文章:基因组各种版本对应关系测试数据及参考基因组的准备RNA-seq(4):下载参考基因组及基因注释下载参考基因组的原因我们测序得到的是几百bp的短read(具体长短还有差异?需要进一步学习), 相当于把拼图打散了给你。如果没有参考基因组,从头(de novo)组装等于是重走人类基因组计划的老路,也就是打散了拼图,却不告诉你原来是什么样子,那么任务将会及其艰巨。目前人类基因组已经组装好了,我们只需要把我们测得序列回贴(mapping)回去,毕竟人与人之间的差距只有不到1%差异, 允许mi原创 2021-03-25 09:30:27 · 3082 阅读 · 0 评论 -
RNA-seq流程学习笔记(17)- PCA图聚类分析
#绘制PCA图#需要使用各组的FPKM进行绘制#对FPKM数据进行整理#清空环境变量rm(list=ls())##将StringTie分析得到的含有FPKM数据的TAB文件导入当前工作环境中#设置工作目录setwd("G:/kongyu/RNA-seq/2021_02_22/gene_tab/")DIPG4_1_1.gene.tab <- read.table("G:/kongyu/RNA-seq/2021_02_22/gene_tab/DIPG4_1_1.gene.tab",原创 2021-03-25 09:18:49 · 7637 阅读 · 0 评论 -
RNA-seq流程学习笔记(16)-Linux系统下完整流程代码
1.关于准备工作2.3.FastQC流程代码4.Hisat2流程代码#! /bin/bash#上面一行宣告这个script的语法使用bash语法,当程序被执行时,能够载入bash的相关环境配置文件。# Program:# This program is used for aligning of RNA-seq data.#History:# 2020/06/19 zexing First release#对变量${i}利用 for $原创 2020-07-07 15:59:43 · 4051 阅读 · 2 评论 -
RNA-seq流程学习笔记(15)-使用DESeq2进行差异基因分析
参考文章:转录组入门7-用DESeq2进行差异表达分析Analyzing RNA-seq data with DESeq21.关于DESeq2的概述A basic task in the analysis of count data from RNA-seq is the detection of differentially expressed genes. The count data are presented as a table which reports, for each sample原创 2020-06-23 14:15:54 · 35192 阅读 · 13 评论 -
RNA-seq流程学习笔记(14)-在windows10平台上利用R包合并表达矩阵、设置实验分组信息、列名及数据的导入导出
(base) zexing@DNA:~/projects/zhaoxiujuan/aligned$ wc -l *.count 24426 m3108.count 24426 m3110.count 24426 m3111.count 24426 m3112.count 24426 m3113.count 24426 m3114.count 24426 msh1.count 24426 msh2.count 24426 Scr.count 219834 total(原创 2020-06-16 16:07:53 · 4013 阅读 · 0 评论 -
RNA-seq流程学习笔记(13)-Bioconductor相关软件的安装(持续更新)
参考文章:因为我的服务器没有外网的原因,尝试了对R设置清华镜像源,可以下载R相关的包,但生物信息学分析会用到很多Bioconductor的软件,需要使用BiocManager软件,试了几次发现服务器中无法安装BiocManager软件,或者使用conda安装了后,在R中无法调用。清华镜像源也提供了Bioconductor的镜像源,说明如下:Bioconductor 镜像源配置文件之一是 .Rprofile (linux 下位于 ~/.Rprofile )。在文末添加如下语句:options(BioC原创 2020-06-11 15:22:34 · 2719 阅读 · 1 评论 -
RNA-seq流程学习笔记(12)-R包的相关操作及国内镜像源的设置
参考文章:4种R包安装方式R语言包相关命令setRepositoriesR install.packages() 设置国内CRAN镜像清华大学开源软件镜像站R语言-默认镜像设置R包安装及设置镜像对于生信老菜鸟来说,学习R语言还真是挺困难的,就像同事说的,R的知识看起来零零散散,怪我自己还没学好R语言入门的书籍。万事开头难啊,硬着头皮上吧。对于RNA-seq流程中,前期数据处理应该对.count文件进行处理,目前所知有三个软件可以使用:DESeq2、edgeR和ballgown。这三个软件好原创 2020-06-11 15:04:53 · 3294 阅读 · 0 评论 -
RNA-seq流程学习笔记(11)-在Linux系统上使用Miniconda3安装R3.6.3
(R4.0) zexing@DNA:~$ conda search rstudioLoading channels: done# Name Version Build Channelrstudio 1.0.44 0 pkgs/rrstudio 1.0.136 1 pkgs/rrstudio原创 2020-06-09 16:33:14 · 1359 阅读 · 0 评论 -
RNA-seq流程学习笔记(10)-使用HTSeq-count软件对reads进行计数
参考文章:转录组入门(6): reads计数RNA-seq练习 第二部分RNA-seq(6): reads计数转录组学习六(reads计数与标准化)1. reads计数的原理对我们测序得到的reads进行计数,即是定量,要解决的问题是根据reads和基因位置的overlap,判断reads到底归类于哪一个基因,根据研究的目的,可以分为三个水平:1. 基因水平(gene-level):常见的软件包括HTSeq-count,featureCounts,BEDTools, Qualimap, Rsu原创 2020-06-04 21:03:51 · 8972 阅读 · 0 评论 -
RNA-seq流程学习笔记(9)-使用RSeQC软件对生成的BAM文件进行质控
参考文章:用RSeQC对比对后的转录组数据进行质控高通量测序质控及可视化工具包RSeQCRSeQC使用笔记在A survey of best practices for RNA-seq data analysis里面,提到了人类基因组应该有70%~90%的比对率,并且多比对read(multi-mapping reads)数量要少。另外比对在外显子和所比对链(uniformity of read coverage on exons and the mapped strand)的覆盖度要保持一致。R原创 2020-06-04 13:08:50 · 8830 阅读 · 1 评论 -
RNA-seq流程学习笔记(8)-使用SAMtools将SAM文件转换为BAM文件、排序、建立索引
参考文章:RNA-seq(5):序列比对RNA-seq练习 第二部分转录组入门(5): 序列比对原创 2020-06-03 20:19:31 · 16518 阅读 · 3 评论 -
RNA-seq流程学习笔记(7)-使用Hisat2进行序列比对
参考文章:RNAseq(4)–Hisat2进行序列比对及Samtools格式转化RNA-seq(5):序列比对:Hisat2hisat2比对软件将reads比对到参考基因组hisat2比对1. 根据比对目的选择不同软件RNA-Seq数据分析可以应用于不同目的的研究中,比如说找差异表达基因、或寻找新的可变剪切。如果找差异表达基因,只需要确定不同reads的数目,可以使用bowtie, bwa这类比对工具,或者是salmon这类align-free工具,并且后者的速度更快;如果需要找到新的isofo原创 2020-06-02 15:55:20 · 38670 阅读 · 16 评论 -
RNA-seq流程学习笔记(6)使用md5sum检验下载数据的完整性
Usage: md5sum [OPTION]... [FILE]...Print or check MD5 (128-bit) checksums.With no FILE, or when FILE is -, read standard input. -b, --binary read in binary mode -c, --check read MD5 sums from the FILEs and check them --tag原创 2020-06-01 11:06:33 · 3876 阅读 · 0 评论 -
RNA-seq流程学习笔记(3)-Linux系统中安装miniconda、设置清华镜像源、安装RNA-seq相关软件、删除环境
主要参考文章:Anaconda介绍、安装及使用教程conda的安装与使用(2019-6-28更新)Anaconda查看、删除、增加channelAnaconda查找源及配置清华镜像Miniconda官网今天开始在服务器上开了一个用户名,所以要重新弄一下所有设置,就从使用Conda开始记录一下,方便以后再搬家时自己查找学习。登录服务器使用的是MobaXterm软件,因此是在Windows环境下通过该软件进入Linux的服务器,很多操作比自己之前用的虚拟机更方便,但可能不是完全的Linux系统,不知原创 2020-05-22 20:32:10 · 6393 阅读 · 0 评论 -
RNA-seq流程学习笔记(4)-使用FastQC软件对fastq格式的数据进行质量控制
今天开始学习使用FastQC软件对范例SRA测序文件的质量进行分析。数据质控是一个综合的评价标准,其中主要指标为碱基质量与含量分布,如果这两个指标合格,后面大部分指标都可以通过;如果这两项不合格,其余都会受到影响。其中一些指标并不适合所有数据,例如DNA测序数据与RNA测序数据之间的差异等,要根据具体数据类型具体分析。...原创 2020-05-19 21:09:29 · 14912 阅读 · 1 评论 -
RNA-seq流程学习笔记(2)-使用Aspera和SRA Toolkit 软件下载.sra和.fastq.gz数据
本文是参考“使用aspera下载.fastq.gz和.sra数据”、"从NCBI-SRA和EBI-ENA数据库下载数据 "和 "Ubuntu16.04下利用Aspera下载NCBI-SRA库基因数据" 几个文章对Aspera进行下载、设置和使用,接上一篇博客对Aspera使用方法做个记录,留作以后学习。查找SRA数据库————————————————————————————————————————————————由于之前先使用SRA Toolkits通过编号直接下载SRA数据,所以最开始直接在网上原创 2020-05-17 15:55:39 · 4081 阅读 · 0 评论 -
RNA-seq流程学习笔记(1)-Ubuntu系统安装SRA数据下载软件Aspera connect和SRT-Toolkit
目前学习了半个月左右,关于Linux系统和Python语言的一些经验和心得后期再整理,先把前两天解决的Aspera软件经验记录一下,免得时间久了忘记。—————————————————————————————————————————————自己本身是做分子生物学的,所以对生物信息的知识很是匮乏,按照自己性格,从头开始学习生物信息学是啥,参考了网上“生物信息学数据库资源”的文章,里面介绍了几个重要的数据库:NCBI、EBI、UCSC等,了解以后需要分析的数据到底是啥玩意;参考“使用aspera下载.fas原创 2020-05-16 20:12:42 · 4803 阅读 · 2 评论