自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(15)
  • 收藏
  • 关注

原创 R语言数学建模(三)—— 模型工作流

前面,我们学习了tidymodels包用于建模的基本流程,学习了parsnip包用于模型的定义及拟合和预测。有了它们,我们的对于不同模型的使用更加的标准化和格式化了。为了进一步规范化建模的过程,tidymodels包还提供了模型工作流的概念,可以将建模的流程封装进一套工作流程中,这样的数学建模过程会更加的系统,也更有利于后续的维护和修改。通过这部分的学习,我们学到了如何对模型创建工作流来管理建模的过程。workflow包括了模型使用的全过程,首先是数据预处理过程,使用。

2024-03-05 16:09:12 1687 1

原创 R语言数学建模(二)—— tidymodels

上一节内容中,简单介绍了使用R语言对数据进行建模的一个工作流程。在R中,为了方便进行数学建模,有一个实用的包——tidymodels。这一节将通过学习这个包,体会其进行R语言建模的流程。至此,我们学习了tidymodels包中进行数学建模的基础做法。包括了如何对数据集进行拆分以用于模型拟合,数据可以根据需要拆分为训练集、测试集和验证集。在数据拆分的时候可以根据数据结构的不同,对数据进行不同层次的划分。当进行数学建模时,通过parsnip包可以使得建模过程更加的同质化,这就是tidymodels。

2024-02-29 22:02:21 1642

原创 R语言数学建模(一)—— 基础知识

这一节开始,我们来学习R语言的又一大功能——数学建模。这是数据分析常用到的数学知识。R提供了一些简洁好用的包,让这一过程变得更加简单易懂。在学习这部分内容的同时,强烈建议自行学习关于统计学的相关知识点,这样在学习到相关内容时才会有更加深刻的理解与收获。本节介绍了关于R建模的基础知识,算是一个对于R建模的引入。其实关于数学建模的知识,可能我们在学习实践中早有接触,只是在当时并未有深刻体会。比如回归曲线就是使用数学建模来拟合一段数据的趋势。

2024-02-27 10:32:06 1487

原创 R语言数据分析(五)

我们学习了数据导入、可视化以及数据转换的相关知识,那么在数据导入后要进行的就是数据的整理,这是一个将凌乱的数据整理成为整洁数据的过程。只有整洁的数据才能很好的进行数据转换分析以及可视化。在这一节的学习中我们将会使用一种称为tidy data的系统在R中组织数据。(注意加载tidyverse包)数据的呈现方式多种多样,下面的示例展示了三种不同的方式整理的相同的数据。

2024-02-22 22:25:40 1309 1

原创 R语言数据分析(四)

上一节我们学习了数据的可视化工具,但是对于数据很少能够直接拿到形式正确的数据。通常需要创建一些新变量或者对变量进行整合后使用。本节中将介绍这些用于数据转换的方法。我们使用的是dplyr包中的函数,它也是tidyverse包的成员之一。另外本节将使用到用做演示的数据来自,请提前加载相关包。本节学习了数据转换的基础方法,包括了对行、列数据的常用操作以及对数据进行分组分析的方法。另外,我们还介绍了管道函数,该函数可以让我们更加高效简洁的将许多操作串联起来对数据进行复杂操作。

2024-02-21 21:40:09 2299 1

原创 R语言数据分析(三)

在这一节,我们初步学习了如何使用R语言的ggplot2进行数据可视化,也学习了很多类型的图形的画法。我们知道了如何在ggplot绘图时设置相应的美学参数以达到不同的作用效果,另外对于不同类型的数据也分别有不同类型的图形可以很好的展示其中数据的关系。这些对应关系所给出的图形示例都不是唯一的答案,要学会自己去学习新的图形的绘图方法,这是很重要的。

2024-02-20 19:08:28 1120 1

原创 R语言数据分析(二)

数据分析的整个流程从数据的导入开始,有多种形式的数据都可以分别导入到R中进行分析。这次我们就从简单的文本数据开始。通过本章学习,我们学到了最简单的一种数据的导入形式,即文本数据,最常见的是csv格式的数据。读取为tibble表格后会自动分析每列数据类型。我们可以通过数据检查来找到其中NA值的表示形式,从而避免类型的错误识别。最后学习了多个文件读取进一个tibble的方法,也学习了数据的输出方式。后续我们会继续学习其他更多格式的数据导入方式。持续更新中…

2024-02-11 13:05:49 1318 1

原创 R语言数据分析(一)

在R语言入门系列,我们已经学习了R语言的基本用法,这节开始我们将进一步学习使用R语言进行数据分析的更多方法。。在进行数据分析的时候往往有多种工具可以使用,编程语言中的Python、Julia也都是非常优秀的工具。大多数数据科学团队也都在使用混合语言。但做事情不能贪多,最好一次掌握一种工具,R是一个很好的起点。接下来的学习中,我将介绍在R处理数据时强有力的实用工具。典型的数据科学研究项目步骤如下图所示:在进行数据分析时,首先应该先将要分析的数据导入R中。

2024-02-09 10:56:21 850 1

原创 R语言入门学习笔记(七)

截至目前,我们已经学习了R的基本知识,也会使用R来编写一些程序。但是在我们平时学习中,可能会遇到要重复完成某个任务,为了实现这个需求,我们来学习循环的用法。循环很好的解决了一些问题,但是不同的写法可能影响代码的运行速度,最后我们来学习一些关于R中特有的代码提速方式来优化我们的代码。通过这节的学习,我们学到了循环在R编程中的运用。善于使用这些循环可以解决很多事情。但是有些循环可以被R中的向量化代码所代替,这样会大大发挥R的优势,使得代码运行速度大大加快。

2024-02-04 15:19:02 1191 1

原创 R语言入门学习笔记(六)

通过前面的学习,我们已经学习了如何去编写R程序,但对于一些个性化的需求可能前面所学的知识还不能满足。比如我们在命令行输入R对象时,命令行可以显示出R对象的内容,其实是调用了print函数来实现的,但是某些时候,print函数返回的格式不是我们想要看到的,如何去更改呢?这就要涉及到这节我们要学到的R的S3系统。S3系统可能会给理解R函数带来困扰,因为我们在尝试理解某个函数时会看到其调用了UseMethod函数。但是现在,我们已经知道了,所以我们可以直接去找到其类方法函数来查看其源代码。这个函数是符合或的。

2024-02-03 12:57:30 933

原创 R语言入门学习笔记(五)

通过先前的学习,我们有了对R语言的初步了解及相关基础知识储备。现在,是时候来编写一些用于解决问题的程序了,在这一节,将介绍关于编写R程序的相关知识。通过本章的学习,我们将对R编程有进一步的了解。关于R编程,可以将复杂的想法分解后分为有序步骤和同类情况来针对编程,关于同类情况可以使用条件语句和查找表来实现。其中查找表满足了向量化编程的需求,是一种方便快捷的方法来对同类情况进行赋值操作。最后,我们学习了很多调试R程序的方法。

2024-02-02 16:28:31 1534

原创 R语言入门学习笔记(四)

这一节,我们将来学习R的环境系统。R的环境系统在使用中是比较无感的,但是学习R的环境相关知识,可以更加清楚的了解R对对象的存储、查找、操作等逻辑。R环境(environment)也可以看作是文件夹的概念(与python编程语言中的环境类似),与计算机存储文件的逻辑类似。计算机中文件夹层层嵌套,形成了一个分层的文件系统,如果想要找到某个文件,就必须在这个文件系统中逐层进行寻找。R存储对象也是类似,每个对象存储在一个环境中,每个环境都与予个父环境。

2024-01-31 12:26:33 960 1

原创 R语言入门学习笔记(三)

目前为止,我们学习了R对象,这可以用于暂存所需要处理的数据。但是,在数据分析的过程中,我们可能随时需要调取这些R对象中的部分数据进行分析,我们要如何对这些数据进行选择和处理呢?这次的学习将会学习到R中取值以及修改数值的方法,这样我们就可以对R中的数据进行提取和修改了。通过本节学习,我们学会了在R中定向的索引数据。可以使用多种方式对R对象中元素进行索引。进行索引后,我们就可以使用赋值函数对R对象中的数据进行修改,注意有需要时在修改前保存数据副本。为了更好的对数据进行定向修改,学习了逻辑值取子集的方法。

2024-01-30 18:40:36 997 2

原创 R语言入门学习笔记(二)

我们已经学习了R语言的基础操作界面以及主要R元素(函数、R包等)。接下来,我们将具体学习R对象(向量、矩阵、数组、列表、数据框)的相关知识。了解R对象将有利于系统了解R语言处理以及存储数据的形式。其中,还会介绍属性与强制转换的概念,这对于更深入了解所有R对象的特征有所帮助。至此,我们了解了R语言中R对象的基本形式。掌握并牢记这些基本的R对象对后续的数据分析十分关键。另外还学到了R对象属性的概念,其中class类属性表示的是R对象的一种类型,这些属性的概念后续还会有重要的应用。

2024-01-29 20:31:40 898

原创 R语言入门学习笔记(一)

R语言是一门主要用于数据分析的编程语言。在诸多领域都有着广泛的应用,R语言的传统强项是建模与作图,其宗旨是为了帮助科学家解决数据分析的相关问题。这里的R语言入门学习笔记系列,想要为自己梳理R学习道路上重要的知识点,并且希望能够帮助到所有想要系统学习R的初学者们。这个部分是通过学习《R语言入门与实践》这本书所获得的部分心得,想要学习的朋友可以去自行阅读此书。有时你可能会想要重复使用某段代码,可以利用复制粘贴进行修改重复使用。

2024-01-28 21:08:36 801

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除