![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
R语言助力生信
文章平均质量分 67
forever luckness
这个作者很懒,什么都没留下…
展开
-
关于风险回归的Cox 模型构建,森林图(1)
主要参考的连接是Forest plot(森林图) | Cox生存分析可视化https://zhuanlan.zhihu.com/p/85675323R语言:多因素Cox回归森林图 (基于forestplot包)https://www.jianshu.com/p/52232599fc3bTCGA-8.TCGA的cox模型构建和风险森林图https://www.jianshu.com/p/fcab6cf2c922需要使用到的R包是library(survival)li...转载 2021-04-10 21:24:15 · 2100 阅读 · 0 评论 -
关于单细胞批次矫正那些事(一)
最近在进行单细胞相关的数据的处理,由于样本是不同的病理时期的,料想它们在测序的时候也是不同步进行的,因此认为批次效应也肯定是存在的,但是之前没有解除过这方面的问题,在网上看了很多技术帖,有一点基础的了解,再进一步的看看文献原著,希望深入的了解单细胞的批次效应,以及在不同的样本数据情况下,用何种批次处理效果好,以及批次处理效果的标准如何评定。A benchmark of batch-effect correctionmethods for single-cell RNA sequencingdata用翻译 2021-03-08 15:38:55 · 7606 阅读 · 0 评论 -
当你使用R安装包出现rdb is corrupt问题的时候
当你使用R安装包,出现如下问题的时候,解决方法是> devtools::install_github('satijalab/seurat-data')Downloading GitHub repo satijalab/seurat-data@HEADError: Failed to install 'SeuratData' from GitHub:61b9eb99/satijalab-seurat-data-0f7a002/DESCRIPTION’ ... lazy-load datab原创 2021-03-02 13:18:09 · 8829 阅读 · 0 评论 -
关于RNA-seq 的那点事Count 数的标准化 (一) RPKM 和FPKM,TPM及C(R)PM
图片来自网络我们都知道,在RNA seq 测序的过程中,我们测完序的最终目的是想根据测序的结果,最终分析得到差异基因以及潜在可能的功能分析,那么在进行差异分析以及对表达量进行分析的时候,对基因原始的Count 进行标准化,消除由于测序过程中单个基因自身的长度以及测序深度对数据的影响,是非常关键的一步。RNAseq 测序,对于一个基因的Count 的计数呢,主要是基于匹配到该基因的外显子上的数目,那么按照这样理解的话,基因越长,比对到该基因(外显子)上的count 数就越多;而影响Count 的...原创 2021-01-10 17:52:38 · 26258 阅读 · 0 评论 -
生新技能树单细胞GBM数据分析(SignleR以及Seurat 联合分析及细胞簇注释
学习是一种态度图片来自网络关于单细胞测序分析,本文主要参考生新技能树团队的帖子和代码,有部分内容属于自己的理解,在此非常感谢生新技能树团队无私的奉献。当然本帖子也参考了大量其他的贴子,参考内容和链接将会在相应地方放出,以便读者学习。单细胞分析技术目前尚多,SignleR和Seruat是主流的分析,之前我们就Seruat 官网上的流程进行了初步的分析,这次的内容主要是结合SingleR 和Seruat 进行单细胞的注释。分析过程主要包括1. 数据的读取和整理数据的下载和读取rm(list=ls原创 2021-01-09 11:31:12 · 4980 阅读 · 0 评论 -
关于基因差异化的那些事 edger Deseq2和limma的使用及一些总结
在基因差异分析的过程中常见的几大差异化常用的R包 主要是edgeR Deseq2 和limma(其中limma 包主要内置于edgeR)那么在分析的过程中呢,每个包有他们各自的一些数据处理方式。在接受的数据格式上和样本数目上呢也存在一些差异。主要如下1.首先关于limma 包进行差异分析参考的博客主要有https://cloud.tencent.com/developer/article/1667505(R包limma作差异基因分析)关于limma 包的一些相关知识limma 主要用于原创 2020-12-27 16:24:13 · 10318 阅读 · 2 评论 -
关于R安装包的方法汇总
R安装包最开始的时候接触的是BiocManager::install(“devtools”),因为当时我的R是3.6以上的版本所以用着种方法来安装包,在3.5以下的版本,当时主要是biocLite进行安装。3.5以下的版本,那么常用的安装命令就是source("https://bioconductor.org/biocLite.R")biocLite(pkg_name)对于3.5以上的版本就是BiocManager::install("devtools")或者可以选择直接本地安装,首先从B原创 2020-12-23 21:14:58 · 2573 阅读 · 1 评论 -
单细胞----关于Seurat的一些知识
关于单细胞的一些知识Seurat 官方网站 https://satijalab.org/seurat/v3.2/pbmc3k_tutorial.html在官网教程中,作者选用的是PBMC的数据,可以从官网进行下载下载后解压缩的文件夹包含三个文件其中barcodes.csv是一个相当于每个细胞身份证的标记,在PBMC中总共有2700个单细胞,所以barcodes 总共有2700行,每一行代表一个细胞genes.tsv呢,是一个ENSEMBL的ID 和一个Symbol 的ID ,总共有32738翻译 2020-12-22 20:14:18 · 13128 阅读 · 2 评论 -
ggplot2作图4
??theme_bw()参数的使用??theme_bw()##用法,其他的几个内部参数相同theme_grey( base_size = 15,##整体布局字的缩放比例 base_family = "bold",##所有的字体 base_line_size = 1/10,##基本的线的粗细 base_rect_size = 1/2)mtcars2 <- within(mtcars, { vs <- factor(vs, labels = c("V-shaped"原创 2020-11-22 23:14:14 · 403 阅读 · 0 评论 -
R语言ggplot2画图3
geom_label()和ggplot_Text()的使用详解主要是用于在图中标注文本??geom_label()可以查看其帮助文档##Examplesp <- ggplot(mtcars, aes(wt, mpg, label = rownames(mtcars)))###建立一个新的画板,标记mtcars的行名p + geom_text()##展示待标记的文本内容,待标记的文本坐标是(wt,mpg) 见图1# Labels with backgroundp + geom_la原创 2020-11-22 21:34:48 · 1373 阅读 · 0 评论 -
R语言作图之ggplot2作图2
1.geom_boxplot()箱线图p <- ggplot(mpg, aes(class, hwy))p + geom_boxplot() ###见图1# Orientation follows the discrete axisggplot(mpg, aes(hwy, class)) + geom_boxplot()###坐标轴位置改变p + geom_boxplot(notch = TRUE)###进行修剪中位线处的尖角 见图2p + geom_boxplot(varwi原创 2020-11-22 11:05:36 · 2848 阅读 · 0 评论 -
R语言作图之ggplot2初识(1)
使用ggplot2进行作图相比于R的内置函数plot,qplot具有的优势是能够绘制动态的图,进行储存例如我们可以这样对qplot进行操作bar1=qplot(foo,bar)bar1##出的是结果图bar1=plot(foo,bar)###但是如果直接对plot的结果进行赋值的时候,其可以直接画图,但是bar1 值不存在使用ggplot2进行作图1.首先从geom_point()进行学习,这个小函数是添加点,其常见的参数有x 传入的数据x值y 传入的数据y值alpha 点的透明原创 2020-11-21 22:50:57 · 3293 阅读 · 0 评论 -
R语言作图基础
R语言作图基础1.简单的Plot画图plot()画图1.直接x,y 二维plot(x,y)2.图形化的参数type 如何画出给定坐标(type=“1”,表示只有线,type=“b”,表示点和线都有,type=“p”,表示只有点,type=“o”,表示用线覆盖点。type=“n”,表示无点也无线)main ,xlab 和ylab 分别表示图形标题,X轴,Y轴的标签col 设置点和线所使用的颜色pch 表示画单独点的特征cex 表示特征扩展,可以控制点的大小lty 代表线型l原创 2020-11-21 17:15:09 · 6320 阅读 · 0 评论 -
生信技能树 linux下安装bowtie2和使用bowtie2进行初步比对
linux下安装软件echo $PATH ##查看路径 echo $PATH|tr ":" "\n"|xargs ls -lhls -lh /usr/bin下载安装Bowtie2首先在root下新建一个Biosoft的文件夹,切换目录到该文件夹cd Biosoft再在该文件夹下,新建一个Bwotie2的文件夹mkdir Bowtie2下载Bowtie2的网址wget https://sourceforge.net/projects/bowtie-bio/files/bowtie/1原创 2020-08-12 22:07:03 · 6387 阅读 · 0 评论 -
Pheatmap做热图数据处理过程
1.原始的FPKM数据a5选择其中的KO2和NC进行处理View(a5)a4=a5[,c(2,3)]View(a4)a6=a4a7=log2(a6+0.0005)col = colorRampPalette(colors = c("blue","white","red"))(80)##col = colorRampPalette(c("lightblue","lightyellow","orange","#FF6A6A"),bias=1)(300)##300表示色阶,从高到低300个原创 2020-07-29 17:07:47 · 16354 阅读 · 4 评论 -
6Y叔的clusterProfiler-book阅读 Chapter 6 KEGG analysis
Chapter 6 KEGG analysis注释包KEGG.db自2012年起就没有进行过更新,并且在clusterProfiler中,richKEGG(用于KEGG路径分析)richMKEGG(用于KEGG模块分析)支持下载最新的KEGG数据进行富集分析,还可以通过将use_internal_data参数显示设置为TRUE来支持使用KEGG.db。有了这个功能以后,生物不仅限于先前版本支持...翻译 2020-01-17 11:36:29 · 1405 阅读 · 0 评论 -
5Y叔的clusterProfiler-book阅读 Chapter 5 Gene Ontology Analysis
计划在年前回家前完成此资料的学习,前几日耽搁的多了些,这两日还是得抽空把这个看完,然后继续学习机器学习相关的内容。。。。。。5.1 Supported organismsGO分析(GroupGO()以及enrichGO()和gseGO())支持具有OrgDb对象的物种。Bioconductor 早已经提供了20种物种,用户可以在OrgDb官网上查找,也可以通过AnnotationForge自己...翻译 2020-01-17 10:02:53 · 2128 阅读 · 0 评论 -
4Y叔的clusterProfiler-book阅读Chapter 4 Disease analysis
Chapter 4 Disease analysisDOSE用于 Disease Ontology (DO) 分析和富集分析,enrichDO函数,主要用于鉴定疾病相关的目标基因,gseDO函数主要用于DO的基因富集分析DOSE也可以用于癌症基因的网络(NCG)以及疾病基因网络(DGN)的富集分析。4.1enrichDO函数的使用选择1.5倍差异的基因用于分析他们的疾病联系。library...翻译 2020-01-13 13:02:11 · 2342 阅读 · 0 评论 -
3Y叔的clusterProfiler-book阅读Chapter 3 Universal enrichment analysis
Chapter 3 Universal enrichment analysisClusterProfiler支持多种基因GO富集分析和和超几何检验,但是不能用于不支持的物种以及slim版本的以及新颖的功能注释(如GO通过BlastGO和KEGG通过KAAS来分析其数据)。ClusterProfiler为超几何分布提供给了enricher函数,为基因富集提供了GEA分析功能,这些功能用户可以...翻译 2020-01-12 23:01:56 · 1655 阅读 · 0 评论 -
2Y叔的clusterProfiler-book阅读Chapter 2 Functional Enrichment Analysis Methods
第二章Chapter 2 Functional Enrichment Analysis Methods2.1DEG后的基因富集分析Y叔讲到DEG后的基因富集分析,p值的通过超几何分布计算出来的其中N是背景分布中基因的总数目(即差异基因的数目),M是注释到目标基因集的基因数目,n是目标基因集的大小,k是注释到基因集列表中的基因数目。默认情况下,背景部分是所有具有注释的基因,可以通过多重比较...翻译 2020-01-12 20:35:26 · 919 阅读 · 0 评论 -
##R语言生信作图之UpsetR做交集图
UpsetR可以识别的数据类型目前我知道的由2种1.一种是由0和1的格式表示的数据集2.第二种格式是直接通过交集的形式展现出来的,分别如下UpsetR包内自带数据集movies导入方法如下movies <- read.csv(system.file("extdata", "movies.csv", package = "UpSetR"), header = TRUE, sep = ...原创 2019-11-19 20:45:56 · 5900 阅读 · 4 评论 -
R语言生信作图代码集合大全
1.利用R语言从多种给癌症中画基因在癌症中的表达的箱线图和小提琴图。rna_cancer_sample <- read.delim("D:/desk_user/morning/TCGA_ALL/rna_cancer_sample.tsv")View(rna_cancer_sample)typeof(rna_cancer_sample$Gene)[1] "integer"t2=as....原创 2019-11-04 14:44:44 · 7543 阅读 · 0 评论 -
生信分析R语言助力作图----单基因批量相关性分析
单基因批量相关性分析嘻嘻嘻~~~,晚上秒变生信分析小白,一个游走在生物学和计算机变成之间的小白,享受着里面的快乐和痛苦。不停的挣扎,不停的成长,多学习,多尝试,一定会有意想不到的收获。加油!!!首先,需要先说明的是本作图经验,完全模仿于果子学生信的一篇博文,所以先把链接丢在这里啦,自己写这篇博文,也完全是为了记录这个操作过程,好在下次需要的时候,更好的去回忆。话不多说,开始表演。https:...原创 2019-10-17 21:26:05 · 13388 阅读 · 2 评论