自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 收藏
  • 关注

原创 三维点图和三维PCA图

3dscatter1.ggplot2画三维点图很轻松找到了R包,然鹅不是很完美的样子。#devtools::install_github("AckerDWM/gg3D")library("gg3D")library(ggplot2)data(iris)ggplot(iris, aes(x=Petal.Width, y=Sepal.Width, z=Petal.Length, color=Species)) + theme_void() + axes_3D() + stat_3

2021-06-23 13:38:10 2300

原创 组建比较不只有箱线图,还有这些

收集了几张漂亮的组间比较图,调整了一些细节,分享给大家。使用的数据时R语言内置数据iris,以下代码都可以直接运行。1.ggstatplot难点是这个R包安装时通常会遇到一些依赖包安装不成功的问题,需要多折腾几下,安好了使用起来就非常轻松咯library(ggstatsplot)ggbetweenstats(iris,x = "Species",y = "Sepal.Length")2.经典箱线图叠加点图library(ggplot2)library(ggpubr)library(pal

2021-06-22 21:23:28 1370

原创 大招:召唤最优的多因素cox模型

AIC信息准则即Akaike information criterion [1] ,是衡量统计模型拟合优良性(Goodness of fit)的一种标准,由于它为日本统计学家赤池弘次创立和发展的,因此又称赤池信息量准则。它建立在熵的概念基础上,可以权衡所估计模型的复杂度和此模型拟合数据的优良性。赤池信息准则的方法是寻找可以最好地解释数据但包含最少自由参数的模型。-摘自百度百科可以使用这一准则得到最优的多因素cox模型,以下是代码实现1.输入数据由生存信息与基因表达量组成的数据框。load(.

2021-06-16 16:42:55 1440 1

原创 好好的表格被放进了pdf,肿么办

0.解决的问题0.1 有些数据的有用信息表格,存放在正文和附件里,以pdf格式提供。就不方便提取,在此记录从pdf里提取表格的办法。0.2 很多欧洲国家的小数点是逗号,比如"3.52"会写成"3,52",除了自己写代码处理字符串,也可以使用哈德雷大神的现成函数parse_double。1.提取表格GSE16011的参考文献附件,下面直接是pdf的网址,也省得下载再读取咯。附表1是接近300个病人的各种信息,占了前10页。全部提取出来是组织成了一个列表的形式,把列表里的每个数据组合起来即可。lib

2021-06-10 11:11:55 132

原创 DCA决策曲线的解读和代码实现

0.决策曲线决策曲线分析法(Decision Curve Analysis,DCA)是个与ROC曲线相提并论的相对比较新的模型评价方法。关于它的原理,长篇大论的医学统计学知识解读实在不是我的强项,放上两个链接偷偷懒:https://www.plob.org/article/12455.html https://www.iikx.com/news/statistics/1622.html如果想看文章,这篇里的fig7就是:https://www.ncbi.nlm.nih.gov/pmc/artic

2021-06-07 17:54:06 16762 5

原创 用诺模图可视化你的模型

花花写于2020.6.2诺模图出镜率很高,用于多因素cox或logstic模型的可视化展示。0.输入数据需要病人临床信息和生存信息表格,如下rm(list = ls())load("ph.Rdata")head(ph)## sample_id gender age T N M stage event time## TCGA-MP-A4T4-01A TCGA-MP-A4T4-01A female 68 2 1 0 2 .

2021-06-02 14:36:24 2569

原创 R语言完成t-SNE分析和画图

1.编一个数据需要一个行为样本,列为变量(例如基因)的矩阵。dat = matrix(rnorm(6000),ncol = 20)dat[101:200,] = dat[101:200,]+rnorm(1,10,10)dat[201:300,] = dat[201:300,]+rnorm(1,15,15)rownames(dat) = paste0("a",1:300)colnames(dat) = paste0("g",1:20)dat[1:4,1:4]## g1

2021-05-27 15:12:18 2813 1

原创 双阈值的火山图

标准的火山图:双阈值的火山图:耶比较常见咯,比如这篇文章里https://pubmed.ncbi.nlm.nih.gov/32278127/其实也没啥。就是设置了两组logFC和Pvalue的阈值,把中间的基因用浅一点的颜色表示出来。我试了同一颜色设置不同透明度,结果失败咯。因为点太密集,设置了透明度,颜色耶会叠加,不好看。1.示例数据随便拿个芯片数据过来,做完他的差异分析,差异分析结果表格。if(!require(tinyarray))devtools::install_github("x

2021-05-12 16:51:49 1426

原创 迄今为止最优秀的配色R包

前言配色是个审美问题,我们通常都是拿别人配好的一组颜色来画图。用来配色的包很多,今天介绍的是一个组合拳,内置了几乎所有配色R包,配色组合数量2000+,可谓是最齐全的了。它吸引我的有两个地方:可以直接在控制台显示出颜色使用起来异常简单明了无缝对接ggplot行吧,三个地方,我不倒回去改了有点激动1.安装if(!require(paletteer))install.packages("paletteer")if(!require(scico))install.packages('scico'

2021-04-12 17:42:12 15064

转载 单细胞三大R包之Seurat

与前面的3版本Seurat有一点点区别,重启大脑ing。。。1.数据、代码和R包准备代码:[https://satijalab.org/seurat/v3.0/pbmc3k_tutorial.html](https://satijalab.org/seurat/v3.0/pbmc3k_tutorial.html)数据:https://s3-us-west-2.amazonaws.com/10x.files/samples/cell/pbmc3k/pbmc3k_filtered_gene_bc_ma

2021-03-22 10:24:07 8527 5

原创 单细胞三大R包之scater

1.准备R包和数据library(BiocStyle)set.seed(10918)library(scRNAseq)example_sce <- ZeiselBrainData()example_sce## class: SingleCellExperiment ## dim: 20006 3005 ## metadata(0):## assays(1): counts## rownames(20006): Tspan12 Tshz1 ... mt-Rnr1 mt-Nd4l#

2021-03-22 00:33:53 2009 1

原创 单细胞三大R包之monocle

0.准备R包和数据library(monocle)library(scRNAseq)library(dplyr)使用scRNAseq里面的示例数据fluidigm。fluidigm = ReprocessedFluidigmData()# Set assay to RSEM estimated countsassay(fluidigm) <- assays(fluidigm)$rsem_countsct <- floor(assays(fluidigm)$rsem_coun

2021-03-22 00:31:39 6837

原创 R语言第四课:神奇R包dplyr

写在前面R包是多个函数的集合,具有详细的说明和示例。学生信,R语言必学的原因是丰富的图表和Biocductor上面的各种生信分析R包。 包的使用是一通百通的,我们以dplyr为例,讲一下R包。安装和加载R包1.镜像设置两行代码↓可以搞定,但这个方法并不适用于每个电脑,有一部分会失败。随缘,失败的话就每次需要下载R包时运行这两句代码即可。你还在每次配置Rstudio的下载镜像吗?2.安装确保联网再操作。。。不然就尴尬了。R包安装命令是install.packages(“包”)或者BiocMa

2021-03-21 13:09:07 808

原创 R语言第三课:神奇R包tidyr

写在前面:一些R包有自己的说明书(cheatsheet),俗称小抄。在对包有了一定的了解后,小抄是一个很好的学习操作指南,但是对于新手来说,很有可能完全看不懂。今天的教程有一部分参照了小抄,并作出了通俗的解释。相信跟着教程走下去,就可以学个七七八八,跟着练练,然后自己研究一下小抄,一个R包就学个差不多啦。准备工作part1:学会获取一个R包的小抄方法1:去百度/谷歌XX小抄方法2:找Rstudio的cheatsheet网站(网速好慢的)https://www.rstudio.com/resourc

2021-03-21 13:08:16 2126

原创 R语言第一课:R和Rstudio

一.认识R和RstudioR是一种编程语言,也是统计计算和绘图的环境,它汇集了许多函数,能够提供强大的功能。R语言软件界面简陋,通常不直接使用,而是用图形界面的Rstudio。RStudio是免费提供的开源集成开发环境(IDE)。RStudio提供了一个具有很多功能的环境,使R更容易使用,是在终端中使用R的绝佳选择。第一次上手,可以先做两个最简单的图:用plot(rnorm(50)) #必应查查plot和runif什么意思boxplot(iris$Sepal.Length~iris$Sp

2021-03-21 13:07:17 13671

原创 R语言基础

1.特点免费:同类的SPSS、SAS、graphpad,都是收费的。支持多操作系统,有了代码就可以跨平台操作切换。输入命令,编写函数和脚本进行批处理运算,语法简单灵活。程序包涵盖各个学科行业。2.在控制台和在脚本窗口输入的区别错误提示的❌简单的计算和画图常用的R包3.入门书籍R语言与Bioconductor生物信息学应用R语言核心技术手册R语言与数据挖掘最佳实践4.赋值与注释 运算注释 复杂几百行 易读性运算符命名:区分大小写不能以数字开头分隔符号5.交集,inters

2021-03-21 13:06:24 291

原创 分清楚技术重复和生物学重复

1.技术重复同一个样品测多次。例如给某伙计取血样,测5次基因表达量能得到的信息1.这伙计精确的基因表达量2.基因表达量测量方法的准确程度(看多次测量的重复性好不好)使用场景1.只关心这一个人的基因表达量,不将研究结果扩展到人群中。2.想说明我们的测量方法是多么准确。从一个人身上取三次样,测三次表达量,仍然是技术重复,因为它只能告诉我们这一个人的信息。这个做法更多是倾向于个体而非方法,因为如果三次表达量测定结果不同,可能是来自样品之间的差别,不能说明方法好或不好。2.生物学重复从三个人

2020-11-23 13:04:54 10424

原创 什么是统计模型

model这个词,意义多样,可以是飞机模型,可以是模特,也可以是数学统计学领域的词汇。模型可以是公式,给定x值,可以根据模型计算,得知y值模型可以是一条直线,也可以不是:总结1.使用模型探索数据间的关系(如上)2.使用统计学方法来确定模型的可靠性和有用性。原视频链接:https://www.bilibili.com/video/BV1nb411p7Q3...

2020-11-23 13:00:41 3730

原创 用warning信息为例,刷一波字符串技巧

其实本来是备课转录组下游分析,安装一个包,出现了一摞error,最后是一摞整齐的warning。non-zero exit status是很常见的一个问题,解决办法是到安装路径,安装路径下每个包是一个文件夹,把报错里的包对应的文件夹找出来删掉,重新运行安装代码即可。之前写过一篇讲这个问题:mac让你找不到路径氮素,我最近复盘了我的R语言基础讲义,tidyverse里的stringr包是缺...

2019-09-05 22:32:54 530

原创 以fasta为例,刷一波R语言小技巧

1.生成一组示例序列先生成一条序列,并且把生成序列的代码写成个函数,函数的输入数据是序列的长度:x= c("A","T","C","G")ms <-function(n){ paste(sample(x,n,replace = TRUE),collapse = "")} ms(25)#> [1] "AAAGGTAGGTGTTGTAGAACTATGT"然后生成一组示例...

2019-09-02 20:59:03 3826

原创 你看这个代码他又臭又长,就不能写好看点吗

举个例子用R内置数据集iris来做图plot(iris$Sepal.Length, iris$Sepal.Width, col=iris$Species)boxplot(iris$Sepal.Length~iris$Species)可以看到,引用iris列名时必须要多写一遍数据框的名字,这样的代码不美观。如果去掉数据框名,单独写列名,则会报错:plot(S...

2019-08-31 21:35:26 626

原创 tidyr的complete和expand函数

对complete和expand有新的理解准备包和数据if(!require(tidyr))install.packages("tidyr")library(tidyr)df <- data.frame( group = c(1:2, 1), item_id = c(1:2, 5), item_name = c("a", "a", "b"), value1 = 2:4...

2019-08-30 20:30:13 583

原创 R包安装问题合集

如果R包安装没有提示error,却又安装失败了,那就需要审视一下是不是有其他提示信息了:例如:其实说的很清楚,需要下载Rtools,但给出的地址是官网地址,下载速度很慢,我们可以用镜像代替:https://mirrors.tuna.tsinghua.edu.cn/CRAN/bin/windows/Rtools/100多兆,飞一般的速度!...

2019-08-30 10:43:30 1967

原创 10分钟获得小分子三级结构(.pdb)

开心,打开公众号后台竟然有700粉丝咯,感谢大家的关注和分享,公众号日更永不断~~~获得本文所需软件:在生信星球公众号(文末有二维码)后台回复:”小分子结构",包括chemdraw、openbabel、pymol打包发给你。要做分子对接需要准备两个文件:蛋白质的结构坐标信息、小分子的结构坐标信息文件,格式是.pdb,这个格式的文件用三级结构可视化软件就可以读取和显示。蛋白的结构坐标信息...

2018-10-16 21:17:56 15357 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除