(免费)R语言学习专栏
文章平均质量分 95
欢迎来到我们的免费 R 语言学习专栏!为了获得更高质量和系统化的 R 学习资源,建议您关注我们的付费专栏《R探索临床数据科学》,在这里我们提供深入的分析和专业的教程。
数据科学和人工智能兴趣组
数据科学和人工智能兴趣组在临床、医药和医药商业分析等领域的教学辅导平台
展开
-
R语言的开发工作始于1992年,那么R语言的发展呢?
R语言的快速发展离不开其强大的开源社区。R语言的早期用户大多是学术界的统计学家和研究人员,他们不仅使用R语言进行数据分析,还积极参与到R语言的开发和扩展中来。随着R语言的普及,越来越多的贡献者开始为R语言开发新的功能、编写文档和提供技术支持。原创 2024-09-14 06:56:52 · 518 阅读 · 0 评论 -
S语言的发展,R语言的发明人
R语言的诞生离不开S语言的影响,特别是在语法和函数结构方面。S语言的一大特点是其面向对象的编程风格,这一特点在R语言中得到了继承和发展。R语言通过函数式编程和面向对象编程的结合,提供了灵活的编程接口,允许用户自定义数据结构和分析流程。原创 2024-09-14 06:53:33 · 321 阅读 · 0 评论 -
机器学习和传统统计学
机器学习和传统统计学是数据科学中相辅相成的两个重要分支。机器学习主要侧重于开发和使用算法来识别数据中的模式,并对未知事物进行预测和分类,它强调自动化和处理大规模数据的能力,通过训练模型从数据中进行学习,以实现高效的预测和识别任务。原创 2024-09-13 21:15:21 · 804 阅读 · 0 评论 -
机器学习是人工智能的一个分支吗?
在R语言中,有几个著名的机器学习扩展包,它们为数据科学家和分析师提供了强大的工具。caret是一个广泛使用的包,简化了模型训练和调参的流程,支持多种算法。randomForest包实现了随机森林算法,常用于分类和回归任务。xgboost包以其高效的梯度提升框架著称,特别适合处理大规模数据集。此外,tidymodels是一个现代化的建模框架,整合了多个包,为机器学习提供了简洁而灵活的工作流程。原创 2024-09-13 19:58:46 · 798 阅读 · 0 评论 -
在人工智能中,“人工”这个词汇是英文单词“artificial”的中文译意,你知道什么是人工智能吗?
计算机技术能够将这个世界上浩如烟海的数据转化为知识、事实和信息。在此,就不得不提及人工智能(Artificial Intelligence, AI)了。在人工智能中,“人工”这个词汇是英文单词“artificial”的中文译意。在日常用语里,“artificial”一词意为合成的(也就是人造的),这往往带有负面意味,意味着“人造物体仅仅是真实物体的次要形式”。原创 2024-09-13 17:20:44 · 740 阅读 · 0 评论 -
初学R语言常见的7个陷阱
在学习过程中,循序渐进是非常重要的。过早追求高深知识可能会导致学习者陷入困境。我们的专栏设计了一条循序渐进的学习路径,从基础到高级,帮助学习者逐步提高。通过专栏的阶段性评估和反馈,学习者可以确保自己在掌握基础知识后,再进入更高级的学习领域。原创 2024-09-13 15:26:04 · 596 阅读 · 0 评论 -
免费且开放的语言,为什么要推荐R?
R语言的一个显著优势是它的免费和开源性。与SPSS、SAS,甚至Excel等商业软件相比,R完全免费。SPSS和SAS这些统计软件虽然功能强大,但通常价格昂贵,对于学生和学者来说,获取和使用这些软件的成本可能非常高。此外,我们常用的OFFICE软件的EXCEL也能进行数据分析,但是定期支付许可费用才能继续使用。原创 2024-09-13 11:40:56 · 660 阅读 · 0 评论 -
R的遍历函数(下)
apply()函数可以作用于矩阵和数据框的行或者列。第一个参数指定了函数应用的数据集;第二个参数必须给出将应用函数的维度,1代表行,2代表列;第三个参数是要应用的函数。原创 2024-09-13 11:19:52 · 570 阅读 · 0 评论 -
R的遍历函数(上)
在R语言中,除了使用循环的方式来操作数据外,我们还可以使用更简洁和高效的遍历函数。这些函数可以帮助我们对数据进行各种操作,避免了显式的循环语句,使代码更加简洁和易读。以下是几种常用的遍历函数及其应用示例。原创 2024-09-13 10:41:30 · 795 阅读 · 0 评论 -
R的高级循环和条件控制
您还可以嵌套多个for循环,这意味着在另一个for循环中有一个for循环。这在处理多维数据结构(如矩阵或数据框)时非常有用。以下是使用嵌套for循环遍历矩阵并打印其元素的示例。原创 2024-09-13 10:36:54 · 710 阅读 · 0 评论 -
R的switch 结构
switch函数根据表达式的值选择并执行相应的代码块。原创 2024-09-13 07:53:07 · 706 阅读 · 0 评论 -
R 循环的 if-else 和 ifelse 结构
if-else结构用于根据条件的真假执行不同的代码块。语法如下:原创 2024-09-13 07:50:09 · 573 阅读 · 0 评论 -
学会R的For循环
在R中,一个基本的控制流构造是for循环,它允许您遍历一组对象,如向量、列表、矩阵或数据框,并在给定的数据结构中的每个项目上应用相同的操作集。另外,这个for循环有助于保持代码整洁,避免不必要的代码块重复。它们使您能够有效地执行重复任务,并可以应用于各种数据结构,使它们成为R编程的通用和必要部分。原创 2024-09-12 20:48:09 · 635 阅读 · 0 评论 -
R的矩阵运算
矩阵的转置是指将矩阵的行和列互换。R语言中的t()函数用于对矩阵进行转置操作。原创 2024-09-12 20:11:14 · 929 阅读 · 0 评论 -
学会R的判断逻辑
xor()函数用于计算两个逻辑值的异或操作。当一个参数为TRUE,另一个参数为FALSE时,结果返回TRUE,否则返回FALSE。原创 2024-09-12 18:15:25 · 859 阅读 · 0 评论 -
R语言中的与或逻辑
逐元素逻辑或运算符|用于逐一比较两个逻辑向量的元素。只要对应位置的两个元素中有一个为TRUE,结果就为TRUE。只有当两个元素都为FALSE时,结果才为FALSE。原创 2024-09-12 17:04:09 · 649 阅读 · 0 评论 -
R的逻辑运算中的关系逻辑
逻辑运算在编程语言中扮演着至关重要的角色,主要用于控制程序的执行流程。R语言中的逻辑运算主要是用于判断条件是否满足,从而执行相应的代码块。逻辑运算通常返回布尔值(TRUE或FALSE),并在条件筛选和数据清洗等过程中发挥重要作用。以下将详细介绍关系逻辑、与或逻辑以及判断逻辑。原创 2024-09-12 16:34:25 · 772 阅读 · 0 评论 -
R的算术远算(下)
掌握这些基本的算术运算,不仅是 R 语言编程的基石,更是开展医学数据分析与建模的关键所在,进而为临床数据的科学分析提供强有力的计算支撑。以下为重要计算函数表,以助大家运用:原创 2024-09-12 15:00:15 · 673 阅读 · 0 评论 -
R的算术运算(上)
整除运算用于计算两个整数相除的商和余数。在医学数据处理中,整除运算可以帮助我们理解数据的分布情况或进行数据分组。原创 2024-09-12 13:05:30 · 760 阅读 · 0 评论 -
R的赋值运算
在R语言中,赋值运算不仅可以对单个变量赋值,还可以通过链式赋值对多个变量同时赋值。这种功能非常便利,可以在一行代码中对多个变量进行初始化或赋值。原创 2024-09-12 11:20:18 · 1006 阅读 · 0 评论 -
R的列表(List)
R语言中,列表是一种非常灵活的数据结构,它可以存储不同类型的对象,如向量、矩阵、数据框、甚至其他列表。与数据框不同,列表中的元素可以是各种类型和长度的对象。这使得列表成为处理复杂数据和非结构化数据的强大工具。创建列表的基本函数是list()。原创 2024-09-12 07:52:04 · 921 阅读 · 0 评论 -
R的数据框(Data frame)
dplyr是R语言中的一个非常流行的数据操作包,它提供了简单且直观的语法来进行数据操作。dplyr主要用于数据帧(data frame)的操作,包括过滤行、选择列、重新排序、添加新列、以及汇总数据等。其中,as_tibble()函数可以将矩阵转换为数据框,并显示更多信息(记得要先自行安装dplyr扩展包)。原创 2024-09-12 07:49:38 · 613 阅读 · 0 评论 -
R的数据结构,数组(Array)
数组(Array)是一种重要的数据结构。它与矩阵有一定的相似性,都只能包含同一类型的数据。然而,数组有一个显著的特点,那就是其维度可以大于 2,这一点与矩阵不同。在 R 语言里,数组通过array()函数来创建。原创 2024-09-11 22:20:09 · 781 阅读 · 0 评论 -
R的矩阵和矩阵运算
矩阵是一种二维数组,每个矩阵仅能包含一类数据(数值型、字符型或者逻辑型)。可以通过函数 matrix() 来构建矩阵。其中,nrow 和 ncol 参数分别用于指定行和列的维数;dimnames 参数包含了可供选择的、以字符型向量形式呈现的行名和列名;byrow 参数表示矩阵应当按行填充(TRUE)还是按列填充(FALSE),默认是按列填充。另外,list() 函数用于创建列表。原创 2024-09-11 21:07:00 · 927 阅读 · 0 评论 -
讲清楚R数据结构中的向量
因子型向量(Factor vector)是将数据存储为整数值向量的一种分类变量(Categorical variables)。它可分为无序分类变量(Unordered categorical variable)和有序分类变量(Categorical variable)两类。其中,在因子变量中所包含的非重复值被称作因子水平。函数 factor() 是以整数向量的形式来存储类别值,其取值范围是[1…k](这里的 k 是名义型变量中唯一值的个数),同时一个由字符串(原始值)构成的内部向量会映射到这些整数上。原创 2024-09-11 17:23:44 · 767 阅读 · 0 评论 -
R的变量类型
数值型变量,又称定量变量(Quantitative variables),是指通过定量方法测定的,具有数值大小(高低或多少)的指标。根据其取值的连续性,数值型变量可以分为连续型变量(Continuous variables)和离散型变量(Discrete variables)。原创 2024-09-11 14:34:34 · 923 阅读 · 0 评论 -
数据的基本概念,变量和对象
变量(Variable)是储存数据的抽象概念,主要为了让数据存放到计算机内存的某个空间位置。可以将变量比作不同大小的“容器”,每个容器可以容纳特定类型和数量的数据元素(或元值、元数据)。这些“容器”有大有小,有的适合装数字,有的适合装字符,还有的可以装更复杂的数据结构,就像我们日常生活中用来装不同物品的箱子、瓶子和袋子一样。原创 2024-09-11 12:44:53 · 730 阅读 · 0 评论 -
认识临床公共数据库和NAHENS
临床公共数据库是指由政府机构、学术机构、医院或其他组织收集并公开发布的临床数据集合。这些数据库通常包含了大量的患者信息、医疗记录、实验数据等,供研究者免费下载或付费使用。临床公共数据库的出现具有以下几方面的意义。原创 2024-09-11 12:03:16 · 879 阅读 · 0 评论 -
网络爬虫(Web Scraping)是一种用于自动提取网页内容的技术,用R如何进行网络爬虫
大家要注意,在使用网络爬虫时,必须遵守相关法律法规和网站的使用条款。一些网站明确禁止爬虫行为,或者要求用户获得许可后才能进行数据抓取。未经授权的大规模爬取可能会对目标网站造成负担,甚至导致法律纠纷。因此,在进行网络爬虫时,应该尊重网站的robots.txt文件,该文件规定了网站允许和禁止爬取的部分。原创 2024-09-11 10:38:53 · 1169 阅读 · 0 评论 -
在R中SQL语言,筛选条件查询数据
我们还可以对数据集按Sepal.Length列进行降序排序,并获取前 3 行数据:输出结果表明iris数据集中,Sepal.Length最大的前三个观测值均属于virginica物种。原创 2024-09-11 07:45:07 · 831 阅读 · 0 评论 -
在R中安装和加载 sqldf 包,并使用SQL语言查询数据库
iris数据集是由 Ronald A. Fisher 在 1936 年引入的经典数据集,广泛用于机器学习和数据分析教学。它包含 150 个观测值,每个观测值代表一朵鸢尾花的测量结果,包括花萼长度、花萼宽度、花瓣长度、花瓣宽度四个变量,以及鸢尾花的种类(setosa、versicolor、virginica)。该数据集因其简单性和多样性,常用于演示分类和聚类算法。iris数据集通过不同种类花朵的测量特征,展示了数据在多维空间中的分布,有助于理解和应用统计方法和机器学习模型。原创 2024-09-11 06:42:44 · 1107 阅读 · 0 评论 -
R与SQL数据库,认识SQL数据库
SQL(Structured Query Language)是一种标准化的编程语言,用于管理和操作关系型数据库。构建SQL数据库在数据存储、管理和检索方面提供了许多显著的优势。原创 2024-09-10 21:36:15 · 1092 阅读 · 0 评论 -
学习R语言,R Markdown 如何写
R Markdown允许用户灵活地控制图形的外观。通过设置图形的尺寸和其他属性,可以确保图形在报告中的显示效果符合要求。具体的设置可以通过以下参数实现:fig.width和fig.height: 这两个参数用于指定生成图形的宽度和高度,单位是英寸。例如,fig.width=10表示图形的宽度为10英寸,fig.height=5则表示图形的高度为5英寸。原创 2024-09-10 20:10:08 · 687 阅读 · 0 评论 -
如何在 RStudio 当中创建 R Markdown 文件
“From Template”栏目代表着可对不同写作模板进行选择。如果你需要使用特定的写作模板,可以选择From Template栏目。这些模板可以帮助你快速创建格式化良好的报告。例如,你可以选择CteX中文套装模板来创建中文报告,并输出为PDF格式。原创 2024-09-10 16:59:46 · 1111 阅读 · 0 评论 -
认识 Markdown 和 R Markdown
R Markdown是 R 语言环境中提供的 markdown编辑工具,运用 R Markdown撰写文章,既可以像一般的 markdown编辑器一样编辑文本,也可以在 RMarkdown 中插入代码块,并将代码运行结果输出在 markdown里。R Markdown 格式,简称为 Rmd 格式, 相应的源文件扩展名为 .Rmd。输出格式可以是 HTML、docx、pdf、beamer 等。原创 2024-09-10 12:13:53 · 917 阅读 · 0 评论 -
用R读取SPSS、SAS、Stata、Minitab等产生的数据文件
一种方法是先将其他统计软件中的数据导出为文本文件,如CSV或TXT格式,然后再使用R的read.table()或read.csv()函数将数据读入R中。这种方法虽然简单,但可能会遇到数据格式不一致、编码出错等问题。也可以使用其它的R扩展包。原创 2024-09-10 12:07:49 · 1004 阅读 · 0 评论 -
Excel文件是日常工作中最常见的数据处理软件之一,用R如何读取它的数据文件呢?
openxlsx包是R中用于读取、写入和格式化Excel文件的工具。与其他Excel处理包相比,openxlsx包不依赖于Java,操作更为简洁高效,支持多种Excel格式的读写。在使用openxlsx包之前,需要首先安装并加载该包。可以通过以下命令安装并加载openxlsx。原创 2024-09-10 06:40:49 · 913 阅读 · 0 评论 -
CSV(Comma-Separated Values)和TXT(文本)文件格式也是常见的数据文件类型之一,用R如何读取?
TXT格式是微软操作系统上附带的一种常见文本格式,早在DOS时代就已被广泛应用。尽管建议使用read.csv()和write.csv()函数处理此类文件,但read.table()和write.table()函数也能完成相关的读取和保存操作,感兴趣的读者可以自行尝试。原创 2024-09-09 23:22:13 · 1111 阅读 · 0 评论 -
R提供了两种原生格式用于存储数据,RDS和RData格式,如何读取?
在这段代码中,readRDS()函数用于从名为data_list.rds的RDS文件中读取数据,并将其赋值给变量data_list_rds。这个函数专门用于读取RDS格式的文件,能够恢复保存的单个R对象。随后,print()函数被用来显示从RDS文件中读取的数据,以便用户检查和验证数据的内容。通过这些函数,用户可以方便地加载和查看之前保存的数据。原创 2024-09-09 18:20:49 · 837 阅读 · 0 评论 -
如何使用直接复制粘贴数据的datapasta扩展包
使用Addins功能:在RStudio的菜单栏中,点击“Addins”按钮,选择“Paste as data.frame”选项。这时,数据将自动粘贴为data.frame格式并显示在RStudio的控制台中,如下图。原创 2024-09-09 14:36:27 · 754 阅读 · 0 评论