自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

R酷的数据科学笔记

分享从无到有的R语言学习过程,期待与大家共同进步~

  • 博客(65)
  • 资源 (1)
  • 收藏
  • 关注

原创 R语言ggplot2 | 热图+随机森林重要性!升级版~

定义了ggrf_ggcor_plot()函数,该函数能够做到一键生成随机森林+热图。

2024-03-22 19:20:29 2046 1

原创 跟着Nature Communications学作图:纹理柱状图+添加显著性标签!

跟着NC学作图:纹理柱状图+显著性添加!

2023-11-01 23:01:07 1676

原创 【R统计】各式各样的插补法解决数据缺失的问题!

R语言数据插补法~地表最全

2023-11-01 21:40:30 1844 3

原创 跟着Nature正刊学作图 | 双轴柱状+折线散点图!

R语言双轴图!

2023-10-31 22:10:00 1119

原创 入门必学 | R语言for循环的常规应用

R语言for循环的常规应用

2023-10-31 21:57:12 866 2

原创 入门必学 | R语言for循环入门指导

R语言for循环入门

2023-10-31 18:52:00 1388

原创 R语言ggplot2 | R语言绘制物种组成面积图(三)

面积图又叫区域图。它是在折线图的基础之上形成的, 它将折线图中折线与自变量坐标轴之间的区域使用颜色或者纹理填充,这样一个填充区域我们叫面积。颜色的填充可以更好地突出趋势信息(比如时间上的差异,分类上的差异),需要注意的是颜色要带有一定的透明度,透明度可以很好地帮助使用者观察不同序列之间的重叠关系,没有透明度的面积会导致不同序列之间相互遮盖减少可以被观察到的信息。与折线图相似,面积图可用于强调数量随时间或分类而变化的程度,也可用于引起人们对总值趋势的注意。他们最常用于表现趋势和关系,而不是传达特定的值。

2023-08-10 11:09:00 1548

原创 【R模型】R语言线性回归之简单线性回归模型 (一)

线性回归,又称普通最小二乘线性回归或简称OLS回归,是由数学家高斯和勒让德在19世纪初左右独立发展起来的,至今仍有关于谁应该为其发现负责的争论。然而,在它被发现的时候,它实际上并不被称为“回归”‍。这个词在弗朗西斯·高尔顿(Francis galton)的作品之后变得更加流行。高尔顿是英国知识分子中的多面手,也是查尔斯·达尔文的表亲。19世纪晚期,高尔顿研究了近1000名儿童的身高与其父母平均身高(父母中等身高)之间的关系。

2023-05-22 08:04:28 4592 1

原创 【R模型】R语言并行计算随机森林模型

并行计算基本上是指在同一实例中使用两个或两个以上(或处理器)来解决一个存在的问题。这里的主要目标是将任务分解为更小的子任务并同时完成它们。一个简单的示例将阐明并行计算的核心思想:如果没有并行运行的过程是:1)输入变量的数值这一看,节省了很多步骤,肯定比上面步骤所运行速度估计得快很多。

2023-05-03 21:38:56 756 2

原创 【R统计】R语言不等长的多重比较—字母标记法

一般来说,在多重比较时候,最大的值是标a,但这里是根据不同水平出现的先后顺序标的,所以有点不尽如人意,所以有了下面的函数。一般来说,anova是可以完成多重比较的,但由于数据是非等长,因此统计功效会大幅缩减,这里故而使用非参数检验 pairwise.wilcox.test()函数。看到在不同水平下,y的数量并不相同,需求就是对比不同水平下y是不是存在显著差异,因为有3个factor,最好是循环完成3个factor下的工作。至此,已经完成了所有非参数的多重比较,按照均值大小标注字母。

2023-05-03 21:19:03 1146 4

原创 R语言ggplot2 | R语言绘制物种组成冲积图(一)

不存在左右先后顺序,不存在箭头表示先后,左右的位置可以随意互换。左/右位置没有特别的意义,尺寸可以按任何顺序排列。

2023-04-25 13:34:52 600

原创 R语言ggplot2 | R语言绘制物种组成堆叠柱状图(二)

堆叠柱状图可以形象地展示一个大分类包含多个小分类的数据,以及各个小分类的占比,显示的是单个分类与总体间的关系。常见的堆叠柱状图:每个柱子上的值分别代表不同的数据大小,各子分类的数据总和代表整根柱子的高度。适用于比较每个分组的数据总量。百分比堆叠柱状图:柱子的各个层代表的是该类别数据占该分组总体数据的百分比。适用于比较各组间的相对变化。

2023-04-25 13:32:25 4211 2

原创 【R统计】美国18年死亡率的分布情况(地图)-- 循环处理与绘图

这里,我想传达的是:学习R语言的最终目的,并不是仅仅为了复制他人代码满足自己的目的,而是能够编写相应的代码来完成(例如,自定义函数、循环函数、编写和创建R包等等)。学习不能一蹴而就,但是R语言算是比较特殊的,它成就感来的比较快,比如今天学一个画图,自己能够模仿编写代码,这在短时间是可以实现的。因为这个数据是1999-2016共18年的数据,我的思路是根据每年先生成18个数据集,然后将他们拆分到每个数据集中,再用将他们打包成list合并,便于后续用到的函数(其要求对象是list数据结构)做准备。

2023-04-21 23:44:48 548

原创 R语言ggplot2 | 修改ggplot主题

与其他软件相比,R语言善于绘图,并且绘图质量极高,其中ggplot2作为R语言绘图神器更是被频繁使用。ggplot2绘图系统拥有图例调整系统、主题调整系统、标签调整系统。但是在实际应用中,我们常因为美化图形主题而感到麻烦,这里面主要是因为记不住复杂的主题调整参数。因此就想,有没有一个能够像Excel那样使用鼠标进行傻瓜式的点点点就可以修改图形。今天在这里向大家介绍一个简单快捷的方法——在实际的ggplot使用中,主题参数众多,我们在可以看到theme的参数众多且复杂。

2023-04-21 23:21:50 1421

原创 R语言ggplot2 | 给图片添加上下标

每次都用PPT来调整图中的细节很麻烦,今天分享R语言添加下标、上标,并且探索在不同位置图元素添加上标和下标。

2023-04-21 23:12:27 3384

原创 自定义函数 | R语言批量计算组间差值

为了处理两列或者多列以及多变量重复样本间的组合差值,编了一个函数进行批量处理。今天与大家分享中我编写的一个cal_repeat函数。为了实现2列变量重复样本的组合差值计算,如图所示:这是y的三个重复值与x的三个重复值组合做差,得出9个新的差值。如何使用R代码?然而,实际情况下,数据集中可能存在实验处理甚至很多个,也可能不只一个目标变量,分组变量也不仅只有2个(也就是x和y可能还有更多需要相互进行组合运算的变量)。

2023-04-21 23:03:44 1368 1

原创 【R生态】R语言维恩图(Venn)&集合图(Upset)的选择与绘制

通常,大家对维恩图的了解较多,因为它在所发表的文章中比较常见。然而,当集合的数量种类较多(超过5个时),其可视化显得杂乱无章。事实上,这两类图所展示的内容的本质是一样的,可以根据自身的实际情况,选择合适自己文章的图形。时,相比于维恩图,集合图展示的结果(不同组的特有或共有信息)依然清晰(当然集合图也是可以改颜色的,这个大家不用担心并不是如此黑)。因此,我们要做的就是根据自己数据的情况,选择合适的集合图形。在进行数据的集合可视化时,即突出不同处理、各组样本之间独有或共有的特征或元素,可以利用。

2023-04-21 08:16:56 3922

原创 【R统计】R语言循环单因素方差分析

数据加载好后,我们需要核查数据,确保无误(必须要求为数值型向量),随后对各样地在六年中植被生物量进行单因素方差分析。是单因素方差分析和多重比较中比较常用的函数,大家肯定非常熟悉,但平时可能进行数据分析的时候需要做很多次方差分析,因此批量单因素方差分析也是很有必要学习和掌握的。需要注意的是,这份数据中有的样地只有一年的数据,这些数据是不能进行差异分析的,我们需要把他们挑出来。函数进行单因素方差分析和多重比较,当我们只有一组(单个样地)的数据时,我们可以直接用如下代码进行单因素方差分析,并获得对应的标签。

2023-04-20 21:33:35 1843 1

原创 【R生态】R语言CPCoA-限制性主坐标分析

CPCoA分析也是属于排序分析的一种。它与PCA,PCoA不同,与CCA或RDA类似。(前者属于非限制性,后者属于限制性;非限制性=非约束性=无监督,限制性=约束性=有监督=典范)这里不过多描述,参考原理,该文对于非限制性和限制性有较为详细的介绍。咱们主要描述R语言实现过程,由于原来函数是计算对应值并直接展示固定的绘图结果,我对amplicon包中函数提取了计算结果的代码。

2023-04-20 00:15:45 2015

原创 入门必学 | Rstudio的快捷键

为了让部分刚接触r语言与rstudio的新手学起来少走些弯路,这里展示了一张rstudio界面的简单介绍图。希望这张图能够给大家带来一些帮助~

2023-04-19 09:52:38 2339

原创 R语言ggplot2 | 绘制随机森林重要性+相关性热图

在文献中,我们经常遇到随机森林和相关性热图的组合图片(下图),它由一幅叠加变量重要性圆圈的相关性热图和一幅说明因变量被解释程度的条形图组成。今天,我们将试着用自己的数据在R里面去复现这类图。

2023-04-19 00:15:36 10339 11

原创 入门必学 | R语言将全矩阵转化为上三角或下三角矩阵

将全矩阵转化成上三角矩阵或者下三角矩阵,这是R语言基础,入门必学。在过程中,主要使用diag函数以及matrix、paste、dim、t等函数的使用。

2023-04-14 09:19:59 2335

原创 【R模型】R语言二元logistic回归 (保姆级教程)

逻辑函数最初是由比利时数学家Pierre François Verhulst在19世纪中期引入的,作为人类、动物和某些植物和水果物种的人口增长建模工具。那时,人们普遍认为,人口增长不可能永远呈指数级增长,环境和资源的限制对人口的规模施加了最大的限制。Verhulst函数的公式为:其中e是指数常数,x0是x在中点的值,L是y的最大值(称为“承载力”),k是曲线的最大斜率。

2023-04-10 00:12:06 16668 1

原创 R语言ggplot2 | 三元图

三元图,顾名思义,是一个等边三角形式的图像,它将本该是三维的x,y,z三轴转化为二维的三角形展示出来,三角形的三个角可以是一个或者一组样本,通过观察三角形中点的位置判断样本在三组间的分布状况。通常这类图用于展示组学数据(进行差异表达基因的分析),作为延伸,也可以用来分析微生物16S/ITS/18S扩增子宏基因组数据,并且可以结合火山图分析,探究微生物在三组样本间的富集状况。

2023-04-02 21:49:14 1108 2

原创 R语言ggplot2 | 告别AI和PS,地表最全R语言拼图

R语言能够完成拼图的包应该有多种。本篇博文中,我给大家总结了地表最常用的四种拼图包,分别是patchwork、cowplot、ggpubr、customLayout。这几个拼图包都可以与绘图神器"ggplot2"包完美的结合,必须掌握。只要我们把这几个包都掌握了就可以与AI、PS真正地say goodbye了~

2023-04-01 19:11:21 2139

原创 【R生态】基于16S的细菌群落的功能预测

R语言16S功能预测 ~ TaxFun4包

2023-04-01 19:03:49 2025 8

原创 【R模型】R语言xgboost模型对分类数据进行预测

xgboost是Boost(提升)算法家族中的一员,Boost根本思想在于通过多个简单的弱分类器,构建出准确率很高的强分类器。简单地来说,Boost(提升)就是指每一步我都产生一个弱预测模型,通过加权累加到总模型中,可以用于回归和分类问题。如果每一步的弱预测模型生成都是依据损失函数的梯度方向,则称之为梯度提升(Gradient boosting),这样若干步以后就可以达到逼近损失函数局部最小值的目标。

2023-03-21 00:55:59 4987 3

原创 第一年创作纪念日--一点点积累,慢慢改变

回忆了一下,来到CSDN已经4年多了。从无知的获取与学习,到无私的贡献与学习,写下了我在CSDN的第一篇博客。回忆整个学习过程,充满了快乐,辛苦,兴奋,成就。创作的初衷,是为了记录下自己在R语言世界中的成长,也希望能够将R实战过程中遇到的问题或者经验分享给其他人,通过CSDN博客也认识了很多志同道合的朋友,欢迎大家一起进行技术交流。写博客是一件开心的事情,希望我日后的每篇博客能如同自己的初衷一样,对自己有用,同时能够帮助其他人。未来一年,希望自己可以输出更多高质量的博客,也希望能够认识更多志同道合的朋友。

2023-03-19 21:53:22 59

原创 R语言ggplot2 | 多图排版

本次分享的例子使用R自带的数据集mtcars,画散点图和箱线图等。如何对多张图进行排版~

2023-03-08 23:54:21 3661 3

原创 R语言ggplot2 | 用百分比格式表示数值

在 R 中将数字格式化为百分比的最简单方法是使用 scales 包中的 percent() 函数。# 此函数使用以下语法: percent(x , accuracy = 1)不懂的函数可以先help或者?函数名(前提需要先加载对应R包)介绍主要的参数:x : 要格式化为百分比的对象accuracy : 要四舍五入的数字。例如,使用 .01 舍入到小数点后两位。

2023-03-08 21:47:14 3225

原创 【R模型】R语言bootstrap检验两个模型斜率的显著性差异

该函数中n阶循环是指可能你的数据集存在多种处理,也就是说存在不同处理变量间组合成新的子数据集。该函数的输出结果返回一个数据框,包含不同处理及bootstrap重采样的模型斜率的结果,最后可以利用统计学检验不同处理变量间的显著性差异。第一,可以实现不同类型模型的斜率比较;第二,可以解决不同变量处理间的多阶循环。主要参数的介绍data : 数据集R : bootstrap的次数sub : 需要对哪些变量进行划分成子数据集的循环equa : 对应构建模型的fomula。

2023-03-08 17:24:46 3136 7

原创 【R统计】R语言相关性分析及其可视化

R语言相关性分析,解决不等长矩阵的相关性分析,值得学习和收藏~

2023-02-26 00:31:43 6642 2

原创 【R模型】R语言支持向量机模型(Support Vector Machines)

R语言支持向量机

2023-02-21 23:50:20 3777

原创 【R模型】R语言梯度提升回归树模型(基于gbm包的GBRT)

R语言机器学习~GBRT模型

2023-02-19 20:44:49 5053 7

原创 【R生态】非参数多元检验(ADONIS、ANOSIM、PERMANOVA及MRPP等多元方差分析)

R语言多元方差分析ADONIS、ANOSIM、PERMANOVA及MRPP的应用~

2023-02-17 00:04:36 10414 4

原创 R语言ggplot2 | 浅谈ggplot2包的学习逻辑

浅谈ggplot2包的学习逻辑~希望对大家有所帮助

2023-02-12 22:48:47 791

原创 【R模型】R语言xgboost模型对时间序列数据进行预测

xgboost预测时间序列数据~

2023-02-12 22:29:52 2418

原创 【R模型】R语言探讨混合线性模型不同类型(二)

R语言比较混合线性模型的不同类型~

2023-02-12 11:31:54 3012 10

原创 ChatGPT在R语言的应用(一)

ChatGPT火爆全球~与它第一次交流,并探讨如何在R语言更好的应用!

2023-02-12 10:40:06 7027 7

原创 【R生态】普鲁克分析(Procrustes Analysis)

普鲁克分析(Procrustes analysis)是一种用于形状分布的分析方法。数学上:通过不断迭代,寻找标准形状(canonical shape),并利用最小二乘法寻找每个样本形状到这个标准形状的仿射变化方式。普氏分析可基于不同多元数据集的排序构型(≥2组),通过平移、旋转、缩放等转换方式,实现最大叠合(maximal superimposition),用于各数据集间的对比分析。排序方法可选择PCA、PCoA、NMDS等。

2022-12-29 11:56:23 3436

向ChatGPT提问的艺术.pdf

《向ChatGPT提问的艺术》是一本介绍如何与人工智能进行有效交流的指南。本书将读者带入到未来可能普遍存在的智能助手交流场景中,并讲解了如何理解和利用AI的特性。读者将在本书中学到如何构建清晰、简明的问题并获得满意的答案,同时,本书还介绍了如何通过语音和图形界面与ChatGPT进行交互。此外,本书还提供了一些实用的技巧和注意事项,帮助读者规避常见的交流问题。《向ChatGPT提问的艺术》旨在帮助更多的人从AI交互中获得更好的体验,同时也鼓励人们更加了解和掌握智能助手的交互方式,向未来的智能化生活迈进。

2023-05-10

中小学生计算机课程.txt

Scratch编程基础课程旨在为中小学生提供一个简单易学的编程语言和编程工具。Scratch是一种由麻省理工学院开发的图形化编程语言,它采用拼图的方式来组合代码,使学生可以直观地学习到编程的基本概念和程序设计的思想。本课程不仅能够帮助学生入门编程,而且能够激发学生的创造力和逻辑思维。课程内容包括Scratch的基本操作、变量、运算符和条件语句的基础、循环和条件语句的高级应用、函数和事件的应用,以及创意编程实践,包括游戏设计和动画制作等。在学习的过程中,学生将通过实践和互动讨论来加深理解,通过个人和小组合作开发项目,培养创造力和团队合作能力。课程结束后,学生将掌握Scratch编程语言的基本原则和数据类型,能够编写简单的程序,并且会使用基本的编程控制结构,如循环和条件控制语句。

2023-04-25

java项目开源源码资源.txt

该文件富含多个java不同类型项目的开源源码网站资源,可以根据自己的需求下载学习。

2023-04-25

数据挖掘分析+课程任务+制造业行业从业人员相关数据+2009至2018年

数据挖掘分析+课程任务+制造业行业从业人员相关数据+2009至2018年

2023-04-25

一份简单的计算机课程设计内容

计算机科学和编程导论:目标:对计算机系统和技术有基本的了解学习编程概念和实践获得解决问题和批判性思维能力为进一步学习计算机科学打下基础持续时间:10周(每周2小时)大纲:第一周:计算机科学概论课程概述和目标计算机的历史和发展计算机的种类及其组成计算机的基本操作和术语第二周:操作系统概论操作系统及其功能概述操作系统的种类(Windows、MacOS、Linux) Windows、MacOS和Linux的基本操作第三周:文件管理简介简介文件系统和文件组织简介了解文件扩展名及其关联关系了解文件基本操作(复制、粘贴、重命名、删除)第4周:办公应用简介办公应用简介Word、Excel、PowerPoint Word、Excel、PowerPoint中的基本操作第5周:编程介绍编程概述及其重要性编程语言类型简介Scratch编程第六周:编程基础变量、数据类型和数据结构基本编程构造(条件语句、循环)函数和过程第七周:面向对象编程面向对象编程概述类、对象和方法面向对象基本概念(封装、继承、多态性)....

2023-02-13

MATLAB中的一个数据分析示例代码,用于一个数据集,其中包含一个人每天消耗的卡路里数量的数据

上面的代码执行以下操作:从Excel文件加载数据并将其保存在变量data中。分别使用平均值、中位数、std和var函数计算数据的平均值、中位数、标准偏差和方差。使用直方图函数绘制数据的直方图,该函数显示数据的分布。使用偏度和峰度函数计算数据的偏度和峰度。这两个值描述了数据分布的形状。使用disp函数将结果打印到命令窗口。对各部分结果的解释如下:均值:这是数据的平均值。它表示数据的集中趋势。中位数:当数据按升序或降序排序时,数据的中间值。它是集中趋势的稳健度量,不受异常值的影响。标准偏差:这是对数据分布的衡量。它表示数据值与平均值之间的距离。标准差越小,数据就越紧密地聚集在平均值附近。方差:这是标准偏差的平方。它给出了数据值与平均值之差的平方的平均值。偏度:这是对数据分布的不对称性的度量。正偏度表示分布尾部在正侧较长,而负偏度表示分布尾部在负侧较长。峰度:这是数据分布峰度的度量。峰度高的分布具有较多的峰值。

2023-02-13

网页设计作业-题目为个人作品集

目标:创建个人作品集网站,展示设计师在网页设计方面的技能、工作和经验。网站应该在视觉上吸引人,用户友好,响应迅速。

2023-02-13

mysql面试题-SQL连接

这个问题测试考生对SQL连接的理解,这是关系数据库管理中的一个重要概念,以及他们将这些知识应用于实际情况的能力。

2023-02-12

java由简到难的面试题

这些问题涵盖了一系列主题,从基本的Java语法和概念到更高级的主题,如数据结构和算法、线程和反射。这应该为面试官和被面试者提供一个好的起点。

2023-02-12

程序员简历模板-less编写

less编写的程序员简历模板,包含个人基本信息、座右铭、总结、技术技能、工作经历还有主持的项目和个人证书等模块。希望能够帮到大家~

2023-02-12

AI资源,包含不同的学习途经,能够快速让你了解AI基础知识,甚至是掌握相应技能

该资料包含网页、在线课程、书籍、会议及期刊等相关AI的学习途经和资料,希望对你有所帮助。

2023-02-12

r语言各类型plot函数

r语言plot函数,包括plot函数、boxplot函数、barplot函数、hist函数、pie函数、heatmap函数。包含R、RMD及PDF结果报告文件。

2023-02-12

R语言数据分析案例-鸢尾花-IRIS

R语言数据分析案例--鸢尾花--IRIS,包含的数据分析如下,数据集描述,描述性统计,相关性分析,逻辑回归,ROC检验,随机森林模型,非线性回归模型等。包含R文件,RMD文件和生成的PDF报告。

2023-02-12

R语言随机森林预测模型

随机森林预测模型,使用R语言中iris例子实现随机森林的分类预测。

2023-02-12

python爬虫步骤及代码

python对于静态和动态网页的爬虫步骤,以及对应静态和动态网页爬虫的具体例子。

2023-02-12

R语言混合线性模型不同类型比较

该资源包含博主推文:机器学习-R语言探讨混合线性模型不同类型的代码和测试数据。完整的数据和代码以便大家更好的进行学习和复现。

2023-02-12

R语言prophet模型的代码和示例数据

R语言prophet模型的代码和示例数据

2022-03-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除