NBIS单细胞教程:细胞类型(六) 此文章是通过学习瑞典国家生物信息学基础设施(NBIS) 所开放的单细胞分析教程加上网上所查找的资料,自身的理解所形成的,可能会有不足之处。该部分是对不同集群的细胞类型进行识别。参考来源:https://github.com/NBISweden/workshop-scRNAseq/blob/master/labs/seurat/seurat_06_celltype.Rmd感兴趣的话可以阅读原文。
NBIS单细胞教程:差异基因(五) 此文章是通过学习瑞典国家生物信息学基础设施(NBIS) 所开放的单细胞分析教程加上网上所查找的资料,自身的理解所形成的,可能会有不足之处。该部分是对不同集群之间的差异基因进行分析。参考来源:https://github.com/NBISweden/workshop-scRNAseq/blob/master/labs/seurat/seurat_05_dge.Rmd感兴趣的话可以阅读原文。
ggplot2-图例 legend就是ggplot绘制过程中,对分类变量产生的一个解释性图像,通常位于ggplot图形的右侧。一般而言,我们可以使用guides,theme,scale_*scale_*guidestheme以下,我们就介绍如何对图例进行修改。
多层饼图-ggplot2 这次需要绘制的如下所示的多层饼状图:总的来说就是对你的数据的分类要求更严格一些,分为大类及大类下面的小类,其实这样的数据可以靠Excel画出来,不过我还是想用R来实现。最开始的时候,按照[【R语言】多层饼图][https://www.jianshu.com/p/7410c023df7b]这个教程的方法去画图,可是在绘制的时候发现了一些问题。
分布数据图-R/python python绘图:https://mp.weixin.qq.com/s/DY_K1CisYElFL7Tt0Si6hw。R语言绘图:https://mp.weixin.qq.com/s/zLIsgnfKgSFjL6jrboIgkg。
排序数据图-R/python R绘图:https://mp.weixin.qq.com/s?python绘图:https://mp.weixin.qq.com/s/DY_K1CisYElFL7Tt0Si6hw。
prinseq PRINSEQ全称是PReprocessing and INformation of SEQuences,拥有在线分析管道,也有命令行版本。PRINSEQ是一个可以用来过滤,转换(reformat),或者剪切基因组/宏基因组数据的一个工具,他可以统计基因组序列质量信息,以图表的形似输出(感觉上和fastqc类似,但实际不一样)。网址:https://prinseq.sourceforge.net/manual.html。
Cutadapt 在对下机数据进行处理的时候,原始的数据一般都带有接头,如果不除去接头序列,会对接下来的基因组装和比对产生较大的误差,所以这个时候需要对原始数据进行接头处理并过滤掉质量较差的序列,其中Cutadapt是一个比较经典的能够对双端进行接头切除的软件。
NBIS单细胞教程:降维聚类(四) 此文章是通过学习瑞典国家生物信息学基础设施(NBIS) 所开放的单细胞分析教程加上网上所查找的资料,自身的理解所形成的,可能会有不足之处。该部分是使用整合后的PCA来进行聚类。参考来源:https://nbisweden.github.io/workshop-scRNAseq/labs/compiled/seurat/seurat_01_qc.html感兴趣的话可以阅读原文。......
NBIS单细胞教程:批次效应矫正(三) 此文章是通过学习瑞典国家生物信息学基础设施(NBIS) 所开放的单细胞分析教程加上网上所查找的资料,自身的理解所形成的,可能会有不足之处。该部分是整合不同批次的单细胞数据并矫正批次效应。参考来源:https://nbisweden.github.io/workshop-scRNAseq/labs/compiled/seurat/seurat_01_qc.html感兴趣的话可以阅读原文。
NBIS单细胞教程:降维(二) 参考来源:https://nbisweden.github.io/workshop-scRNAseq/labs/compiled/seurat/seurat_01_qc.html感兴趣的话可以阅读原文。
NBIS单细胞教程:质控(一) 此文章是通过学习瑞典国家生物信息学基础设施(NBIS) 所开放的单细胞分析教程加上网上所查找的资料,自身的理解所形成的,可能会有不足之处。该部分是对下机处理完成后的数据进行Seurat分析的质控。参考来源:https://nbisweden.github.io/workshop-scRNAseq/labs/compiled/seurat/seurat_01_qc.html感兴趣的话可以阅读原文。
生物基因结构 最近需要对启动子区域进行预测,所以首先对启动子的结构特征进行了解,而说到启动子,那就一定要了解基因结构,所以,在网上查找了部分资料进行整理与学习。首先,根据RNA合成的不同时期,从DNA到成熟mRNA,分为三个阶段了解基因结构的变化。......
GFFcompare详解 当与参考注释(也作为 GFF 提供)进行比较时,程序 gffcompare 可用于比较、合并、注释和估计一个或多个 GFF 文件的准确性。Github:https://github.com/gpertea/gffcompareReference: http://ccb.jhu.edu/software/stringtie/gffcompare.shtml下载与安装源码安装wget http://ccb.jhu.edu/software/stringtie/dl/gffcompare-0.1
Stringtie详解 StringTie 是一种快速高效的将 RNA-Seq 比对到潜在转录本的组装器。它使用新的网络流算法以及可选的从头组装步骤来组装和定量代表每个基因位点的多个剪接变体的全长转录本。它的输入不仅可以包括其他转录组装器也可以使用的短读取比对,还可以包括从这些读取组装的较长序列的比对。为了识别实验之间的差异表达基因,StringTie 的输出可以通过专门的软件如 Ballgown、Cuffdiff 或其他程序(DESeq2、edgeR 等)进行处理。下载与安装源码安装wget http://ccb.jh
NR数据库的物种注释 NR数据库的物种注释1.创建NR子库为什么要创建nr或nt数据库的子库,因为这两个库数据量巨大,若只专注某个领域而非全部,则在对自身领域进行注释时就会耗费大量时间,为了节省时间,就需要在原来nr/nt数据库的基础上构建相对的子库。构建方法如下:方法一:从NCBI官网下载相应物种的Accession ID在2017年之后的nr/nt数据库变成不再支持gi号搜索的。所以我们不可以根据gi号来分离并构建对应的子库,那么我们就需要查看新版本的nr/nt库的序列的id特征,发现他们变成了accessio