自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(36)
  • 资源 (2)
  • 收藏
  • 关注

原创 R统计绘图-线性混合效应模型详解(理论、模型构建、检验、选择、方差分解及结果可视化)

​此文主要涉及线性混合效应模型分析,主要包含以下几部分内容:1)混合模型基础知识; 2)线性混合效应模型构建(lme4)、检验、解读及可视化;随机截距与随机斜率模型3)线性混合效应模型方差分解及可视化;4)线性混合效应模型比较及选择;

2023-09-24 17:51:53 6645 10

原创 R统计绘图-多元线性回归(平均加权模型/最优子集筛选,MuMIn)

输出结果中Estimate, Std. Error, t value, Pr(>|t|):依次表示对应自变量的回归系数及其标准误,回归系数检验的t检验统计量及其p值。分类因子作为自变量时,然后使用MuMIn::model.avg()利用模型平均的方法获得所有满足筛选条件的模型加权后的最优模型参数估计。平均加权模型中包含的模型子集以及"full"和““subset””平均模型的回归系数检验结果。此处介绍如何使用MuMIn包进行最优子集回归,筛选特征,根据模型筛选准则筛选模型以及构建平均加权模型。

2023-03-21 15:47:50 1236 1

原创 R统计绘图-多元线性回归(最优子集法特征筛选及模型构建,leaps)

应该是实验设计中就明确的事情。研究自变量线性问题,常用方差膨胀因子(Variance Inflation Factor,VIF)这一统计量,VIF是一个比率,分子为使用全部特征拟合模型时该特征的系数的方差,分母为仅使用该特征拟合模型时这个特征的系数的方差。误差是模型的一个总体参数,是模型中的误差项,描述的是因变量被随机因素导致的变化,即真实值和预测值之间存在的差异。实际上,有时只使用某种统计分析方法,或只看统计分析的统计量,而不看使用该统计方法的前提,或不进行数据探索,最后得到的分析结果可能与实际有偏差。

2023-03-21 15:45:06 4511 1

原创 R统计绘图-NMDS、环境因子拟合(线性和非线性)、多元统计(adonis2和ANOSIM)及绘图(双因素自定义图例)

在PCA、PCoA、CA和NMDS非约束排序方法中,只有NMDS不是基于特征向量的排序方法,不会最大化排序轴所代表的变量方差(可旋转轴,达到PCA的效果,PC1代表最大方差)。书中提到PCoA等的排序结果,可以作为NMDS的输入,用于将超过2-3D的数据空间,在2-3D的维度展示出来。)提到“NMDS分析对0值不太敏感,即使有较多的0,也可以得到较为稳健的结果”。如果拿不准要选择那种转换方法和距离指数,就在满足分析假设的前提下,把所有分析都做一遍,选择分析效果更好的方法就行,不要让自己陷入纠结,浪费时间。

2023-02-23 19:57:53 2248

原创 R统计绘图-PCA详解1(princomp/principal/prcomp/rda等)

PCA分析之后我们会得到主成分、主成分特征根以及变量(特征)得分,那么这些分析结果是怎么得到的呢?以及它们各自代表什么意义呢?带着这些疑问,我们可以开始学习此章节。主成分其实是分析用变量的规范化线性组合。PC1是能够最大程度解释数据中的方差的特征线性组合。PC2是另一种特征线性组合,其在保持与PC1方向上垂直(PC1与PC2完全不相关)的情况下,最大程度解释数据中的方差。PCA分析最多可以构造与变量数相等的PC(要求样本/观测数必须大于变量数)。PC3…PCn都遵循这个规则。图1|二维空间主成分示意图。

2023-02-23 19:29:10 1516

原创 R统计绘图 | 物种组成堆叠面积图(绝对/相对丰度,ggalluvial)

数据使用的不同处理土壤样品的微生物组成数据,包含物种丰度,分类单元和样本分组数据。此数据为虚构,可用于练习,请不要作他用。数据表和代码可从QQ交流群文件夹中下载,或EcoEvoPhylo公众号后台发送“Stackarea_map”获取。图3|按门汇总的各处理物种丰度均值数据,phy。图1|物种丰度及分类单元注释信息,spetax.csv。图5|按门汇总的各处理物种相对丰度数据,rel_phy。图4|绝对丰度堆叠面积图,abs_area.pdf。图6|相对丰度堆叠面积图,rel_area.pdf。

2023-02-23 18:54:55 850 1

原创 R统计绘图 | 物种组成冲积图(绝对/相对丰度,ggalluvial)

数据使用的不同处理土壤样品的微生物组成数据,包含物种丰度,分类单元和样本分组数据。此数据为虚构,可用于练习,请不要作他用。图3|按门汇总的各处理物种丰度均值数据,phy。包在门水平绘制物种组成冲积图,可以绘制绝对丰度冲积图,也可以使用相对丰度绘制冲积图。图1|物种丰度及分类单元注释信息,spetax.csv。图5|按门汇总的各处理物种相对丰度数据,rel_phy。图4|绝对丰度冲积图,abs_allu.pdf。图6|相对丰度冲积图,rel_allu.pdf。图2|样本分组信息,group.csv。

2023-02-23 18:24:53 1333

原创 R统计绘图 | 物种组成堆叠柱形图(绝对/相对丰度)

数据使用的不同处理土壤样品的微生物组成数据,包含物种丰度,分类单元和样本分组数据。此数据为虚构,可用于练习,请不要作他用。图1|物种丰度及分类单元注释信息,spetax.csv。图2|样本分组信息,group.csv。

2023-02-23 18:12:32 3395 1

原创 机器学习-多元分类/回归决策树模型(tree包)

当最低错误率,具有几个不同的终端节点数时,可以秉承简单模型的原则,选择最小的终端节点。但是低于某个阈值的拆分点的之后的拆分点可能降低RSS的能力很强,所以不能随意剪枝。剪枝的标准主要为获得的子树的错误率最低,常用交叉验证选择具有最低错误率的子树。后面重复此过程,寻找最佳预测空间和拆分点,从而使每个结果区域的RSS值最小,直到达到终止拆分标准,比如每个终端节点包含的样本数都不高于设定的阈值。经过上述过程,构建的模型可能会过拟合,导致模型对训练集数据有很好的预测能力,但对测试集数据的预测能力较差。

2022-09-11 04:47:31 4644 1

原创 R统计-单因素ANOVA/Kruskal-Wallis置换检验

置换检验的经验分布如果依据的是数据所有可能的排列组合,则称为"精确"检验(两样本置换检验才能使用),如果样本量很大,为减少计算量,可以使用蒙特卡洛模拟,从所有可能的排列中进行抽样,获得一个近似的检验,但其是使用伪随机数从所有排列组合中进行抽样,因此,每次检验的结果都有所不同,大样本近似随机检验,可使用固定随机值,保证结果的可重现性。7)如果实际的检验统计量,如t0,落在经验分布中间95%部分的外面,则在0.05的显著性水平下,拒绝组间总体均值相等的零假设。4)计算并记录新观测数据的检验统计量;

2022-09-11 03:22:38 2367

原创 R统计绘图-变量分组相关性网络图(igraph)

igraph绘制相关性网络图。

2022-09-11 02:28:49 4105

原创 R统计绘图-随机森林分类分析及物种丰度差异检验组合图

此文主要涉及随机森林组间变量重要性和物种丰度差异检验绘图,包含以下几部分内容:1)随机森林分类;2)随机森林分类变量重要性绘图;3)物种丰度差异检验绘图4)随机森林分类变量重要性及物种丰度差异组合图1. 数据准备此处使用包含分类信息的虚构微生物otu数据,用于构建随机森林分类模型。图1|原始otu表,otu.csv。前两列为分类信息,后面分析只使用depth分类信息。图2|相对丰度otu表,spe。ntree(构建决策树数量),mtry(用于构建决策树的变量数)和maxnodes(最大终端节点数)是随

2022-06-27 00:22:09 1783

原创 R统计绘图-环境因子相关性+mantel检验组合图(linkET包介绍1)

linkET是ggcor作者的新包,最常用于绘制结合相关性分析+mantel test绘制相关性组合图。但其实他还有绘制随机森林、热图等功能,绘制出来的图也很美观。后续将分几篇文章介绍linkET包的使用。第一篇先介绍使用的最多的功能-绘制相关性组合图。表1|微生物数据,otu.csv。表2|代谢组数据,met.csv。表3|环境因子数据,env.csv。2. 相关性图图1|环境因子相关性计算结果,cor。图2|默认参数相关性图,cor.p1。图3|调整参数后相关性图,c

2022-06-01 23:17:37 3071

原创 机器学习-分类随机森林分析(randomForest模型构建、参数调优、特征变量筛选、模型评估和基础理论等)

此文主要涉及随机森林分类分析,主要包含以下几部分内容:1)随机森林基础知识2)randomForest()认识及构建分类判别模型;3)随机森林参数调优4)随机森林模型评估classification rate、Sensitivity和specificity和ROC curve/AUC value5)特征变量重要性筛选及绘图重要性指数排序、交叉验证及Boruta算法筛选一、 准备数据此处使用的包含......

2022-05-15 01:06:28 5250 2

原创 R统计绘图-多变量相关性散点矩阵图(GGally::ggpairs())

进行相关性分析之后,就要选择分析结果的展示形式。前面介绍过是用corrplot包绘制相关性热图展示结果(R统计绘图-corrplot绘制热图及颜色、字体等细节修改),这里介绍另一种展示形式,使用ggplot2绘图扩展包-GGally包的ggpairs()展示相关性分析结果,图中同时展示数据散点图和相关性结果。这在R统计绘图-One-Way MANOVA一文中有展示过。一、 数据准备# 1.1 设置工作路径setwd("D:\\EnvStat\\corrplot")# 1.2 加载R包

2022-04-27 23:06:19 2408 1

原创 R绘图-物种、环境因子相关性网络图(简单图、提取子图、修改图布局参数、物种-环境因子分别成环径向网络图)

https://doi.org/10.1016/j.soilbio.2020.107782有师妹想要绘制一张类似上图的环境因子-物种相关性网络图。这张图其实还挺好复现的,将环境因子与物种都作为变量一起计算相关性指数,然后绘图时更改网络图的布局参数,将环境因子与物种分内外环放置。下面使用虚构数据绘制一幅类似的图。一、 导入数据相关性系数的计算在前面很多文章R统计绘图-分子生态相关性网络分析都写过,这里不再赘述。这里直接导入相关性指数计算结果,r与p值矩阵。物种名中的空格、-等特殊字符需要注..

2022-04-27 22:47:42 7940 11

原创 R绘图-KEGG功能注释组间差异分面条形图

一、 数据准备KEGG功能注释的差异分析结果绘图。使用的是经过Pairwise Mann–Whitney U-tests检验的处理间class II功能丰度差异结果数据,包含class I作为分面信息进行条形图绘制。library(ggplot2)library(ggsci)library(ggpubr)library(scales)# 1.1 读入数据data = read.csv("KEGG.csv",header=TRUE,sep=",",stringsAsFactors = F

2022-04-27 22:20:48 943

原创 R统计绘图-多变量单因素非参数差异检验及添加显著性标记图

一、 数据准备数据包括36个样本,4个处理,7个环境因子,研究目的是为了比较处理间每个环境因子是否存在差异。# 1.1 设置工作路径setwd("D:\\EnvStat\\stat")getwd()#获取工作路径# 1.2 导入数据env = read.csv("env.csv",header = TRUE,row.names = 1,stringsAsFactors = FALSE)dim(env)head(env) # 第一列为分组信息,2-8列为环境因子数据图1|环境

2022-04-27 22:11:35 1143

原创 R统计绘图-使用rgl或pca3D包绘制3DPCA图

虽然PCA和RDA分析及绘图都写过教程,但是对于结果的解释都没有写的很详细,刚好最近有人询问怎样使用FactoMineR factoextra包进行PCA分析。所以使用R统计绘图-环境因子相关性热图中的不同土壤环境因子数据进行PCA绘图和结果解读推文。一、 PCA分析过程1.1 数据准备# 1.1.1 设置工作路径setwd("D:\\EnvStat\\PCA\\3DPCA")getwd()#获取工作路径# 1.1.2 调用R包library(factoextra)library(

2022-04-27 21:31:38 708

原创 R统计绘图-PCA分析绘图及结果解读(误差线,多边形,双Y轴图、球形检验、KMO和变量筛选等)

虽然PCA和RDA分析及绘图都写过教程,但是对于结果的解释都没有写的很详细,刚好最近有人询问怎样使用FactoMineR factoextra包进行PCA分析。所以使用R统计绘图-环境因子相关性热图中的不同土壤环境因子数据进行PCA绘图和结果解读推文。一、 数据准备# 1.1 设置工作路径#knitr::opts_knit$set(root.dir="D:\\EnvStat\\PCA")# 使用Rmarkdown进行程序运行Sys.setlocale('LC_ALL','C') # Rmark

2021-12-14 18:47:59 3734 1

原创 Alignment--本地blast使用详解1-数据库序列检索下载及比对

是一篇来自2018年10月7日的笔记。当时做了一批土壤氨氧化细菌(AOA/AOB)的amoA基因的克隆测序,需要对测序结果进行批量鉴定。为了节省时间,自学了blast本地比对,当时还使用的blast-2.7.1+版本。现在随意从NCBI下载了一些序列,重现并更新一下笔记。一、软件安装现在是ncbi-blast-2.12.0+版本,下载网址:ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/。# Linux下载wget

2021-11-27 13:35:26 4921 3

原创 R统计绘图-VPA(变差分解分析)

变差分解分析(Variance Partitioning Analysis)可用于确定指定环境因子对微生物(原生生物/植物/动物等等)群落结构变化的解释比例。要计算指定环境因子与群落结构的相关性,就需要约束非指定环境因子的同时,对指定环境因子做排序分析。其实就是相当于做partial排序分析。公众号文章《R统计-PCA/PCoA/db-RDA/NMDS/CA/CCA/DCA等排序分析教程》写过如何使用vegan包进行偏分析。本文记录一下使用vegan包进行VPA分析的两种方法。一、 数据准备# 1

2021-11-27 13:02:59 9206 1

原创 R统计绘图-分子生态相关性网络分析(拓扑属性计算,ggraph绘图)

一、 分子生态网络简介分子生态网络分析是一个极具前景的群落生态分析方法,它能够较为轻松的探究出不同环境中的不同生物特征(物种或基因等)间的相互作用关系或共存模式。通过确定整个网络中的具有高连接度的微生物特征或该特征在模块内所处的位置,可以得到整个网络中的关键物种或基因(hub nodes)以及一些较为重要的物种或基因。这一类微生物特征可能对于微生物群落的结构和功能有着一定的决定作用。网络分析方法已经被广泛的应用于各个环境中的微生物群落的研究,在探寻微生物群落的特有属性、结构、功能以及群落的复杂性和稳定性

2021-09-16 20:45:36 4788

原创 R统计绘图-One-Way MANOVA

存在两个及以上连续结果(或响应)变量的ANOVA被称为多变量方差分析(Multivariate Analysis of Variance,MANOVA)。例如,将小鼠分为处理A和处理B两组后,测量小鼠的长度和高度。此时小鼠的长度和高度就是结果变量,假设长度和高度都因为处理不同产生差异。此时可以使用MANOVA检测上述假设。MANOVA分析过程总结如下:1)将所有结果变量经过线性组合形成一个新的复合变量;2)比较新变量在分类变量中的均值。本文接下来描述在R中如何进行MANOVA。一、

2021-09-09 10:23:57 2420 1

原创 R统计绘图-corrplot热图绘制细节调整2(更改变量可视化顺序、非相关性热图绘制、添加矩形框等)

上一篇文章推送的是怎样调整corrplot热图的可视化参数,以修改字符和图例位置,数据可视化形式和字符小大和颜色等这篇是一个补充部分,记录怎样修改参数以变量排序方式和突出部分数据。本流程还是使用R统计绘图-环境因子相关性热图中的不同土壤环境因子数据进行相关性分析、绘制热图并进行图细节更改。流程开始按下图整理环境因子数据,行为样品名称,列为环境因子名称和分组信息,共有11个环境变量,3个分组信息。图1|环境因子及分组信息表,env.csv。1 设置工作路径并调用R包#设置工作路径#...

2021-09-05 18:30:30 9165

原创 R统计绘图-corrplot绘制热图及颜色、字体等细节修改1

有师妹想要更改热图的颜色和字体,想着之前相关性绘图等推文只是使用corrplot默认的颜色绘图,为了帮师妹解惑,今天就写一篇,怎么设置热图颜色和字体等细节到推文。其实看一遍R语言实战|入门3:图形初阶,就可以基本了解R中图形细节的设置。本流程还是使用R统计绘图-环境因子相关性热图中的不同土壤环境因子数据进行相关性分析、绘制热图并进行图细节更改。流程开始按下图整理环境因子数据,行为样品名称,列为环境因子名称和分组信息,共有11个环境变量,3个分组信息。图1|环境因子及分组信息表,env.csv。..

2021-09-05 18:02:57 14135 5

原创 R统计绘图-rgbif包下载GBIF数据及绘制分布图

1基本信息博士退学前,做完斑马鱼的Phylogenomics分析,系统进化树冲突、基因流、ILS和种群历史动态等分析了之后,需要看一下Danio属物种的地理分布,希望能跟Phylogenomics分析结果有所印证。所以,自己在网上搜索生物分布数据库,找到了很多有物种分布数据的数据库(可惜当时没有好好整理成文档),要不就是不全,要不就是不容易整理(还是编程能力不强)。最后发现了GBIF(Global Biodiversity Information Facility,https://www.gbif...

2021-08-30 17:51:25 2956

原创 R统计绘图-环境因子相关性热图

1 基本信息本流程是进行不同土壤环境因子相关性分析并绘制热图,流程开始按下图整理环境因子数据,行为样品名称,列为环境因子名称和分组信息,共有11个环境变量,3个分组信息。图1|环境因子及分组信息表,env.csv。2 分析流程2.1 设置工作路径并调用R包# 设置工作路径#knitr::opts_knit$set(root.dir="D:\\EnvStat")# 使用Rmarkdown进行程序运行Sys.setlocale('LC_ALL','C') # Rmarkdown全局

2021-08-22 14:11:20 9078 2

原创 R统计-PCA/PCoA/db-RDA/NMDS/CA/CCA/DCA等排序分析教程

这里写自定义目录标题R统计-PCA/PCoA/db-RDA/NMDS/CA/CCA/DCA等排序分析教程一、定义二、分类2.1 根据物种响应环境梯度模型分类2.2 根据是否使用环境因子数据分类2.2.1 unconstrained ordination(非约束排序/间接排序) :只使用物种组成数据的排序2.2.2 constrained ordination(约束排序/直接排序):使用物种和环境因子数据排序2.3 偏分析(partial analysis)2.3.1 Partial methods of u

2021-08-10 17:46:45 2070

原创 微生物群落结构差异分析

微生物群落结构差异分析输入的数据格式与RDA分析格式相同spe:群落组成数据group: 分类数据env:环境数据:土壤理化因子、植物类别等library(vegan)# ADONIS/PERMANOVA-PCoA# β多样性指数可以选择不同的指数adonis(spe~ grazing,data = group,permutations = 999,method="bray") ->grazing.bray # 用grazing分组spe,并进行Adonis分析,分析结果赋予grazi

2020-06-02 18:34:54 3576

原创 ubuntu18 修改交换分区大小以解决卡顿问题

ubuntu18 修改交换分区大小以解决卡顿问题#查看物理和交换内存free -m#优化swap参数,数字大小表示使用swap空间的积极性,数字越大越积极sysctl vm.swappiness=10ksudo gedit /etc/sysctl.confvm.swappiness=10#扩展swap空间df -h # 查看磁盘剩余空间#创建swap文件mkdir swap...

2020-01-04 01:53:06 480

原创 RDA排序修改

library(vegan)library(ggplot2)library(permute)library(lattice)spe=read.table("spe.csv",header=T,row.names=1,sep=",")envi=read.table("env.csv",header=T,sep=",",row.names=1)#选择有显著性相关关系理化因子group &l...

2019-12-26 13:06:47 557

原创 corrplot相关性系数组合图精简版

library(ggplot2)library(vegan)Arf=read.csv("Arf.csv",sep=",",header=T,row.names=1)Com=read.csv("Com.csv",sep=",",header=T,row.names=1)Sti=read.csv("Ste.csv",sep=",",header=T,row.names=1)Cle=

2018-10-26 17:38:57 2082

原创 相关性系数图组合图

library(ggplot2)library(vegan)A=read.csv("A.csv",sep=",",header=T,row.names=1)B=read.csv("B.csv",sep=",",header=T,row.names=1)C=read.csv("C.csv",sep=",",header=T,row.names=1)T=read.csv(&quot

2018-10-26 11:45:56 1931

原创 微生物生态数据分析——冗余分析

微生物生态数据分析——冗余分析sa=read.table("NRRDA.csv",header=T,row.names=1,sep=",")env=read.table("NRenv.csv",header=T,sep=",",row

2018-10-25 17:13:27 7592 2

原创 微生物生态排序分析——CCA分析

微生物生态排序分析——CCA分析library(vegan)library(ggplot2)library(permute)library(lattice)sa4=read.table("spes.csv",header=T,row.names=1,sep=",")S8.p=read.table("S8.p.csv",header=T,se

2018-10-25 17:12:58 5099 18

R绘图-物种、环境因子相关性网络图(简单图、提取子图、修改图布局参数、物种-环境因子分别成环径向网络图)代码与数据

R绘图-物种、环境因子相关性网络图(简单图、提取子图、修改图布局参数、物种-环境因子分别成环径向网络图)原始数据与代码。 https://blog.csdn.net/qq_39859424/article/details/124462727

2023-02-23

分组变量网络图推文对应代码和原始数据

分组变量网络图推文对应代码和原始数据。https://blog.csdn.net/qq_39859424/article/details/126801700?spm=1001.2014.3001.5501

2023-02-23

分子生态网络绘图示例数据和代码

igraph绘制网络图

2022-09-11

网络图制作软件

可以制作网络关系图,微生物、基因共表达网络关系,生物之间、生物与环境之间的相互关系图。

2018-04-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除