下面内容摘录自《用R探索医药数据科学》专栏文章的部分内容。
1)栏目后续章节的文章将深入概括R语言在临床研究和新药创新领域的应用,填补了国内R教材中尚未广泛覆盖的部分内容。
2)专栏每篇文章都在 5000 字以上,质量平均分高达 94 分。已发表章节也会增加新的文章,已发表的文章也会更新版本,可留意专栏内容和题目信息。
3)由于每结束一个章节,专栏的优惠力度就会减小,当下正是订阅的最佳优惠时段,诚邀各位积极订阅!看全文请点击下面链接。
欢迎订阅我们专栏
.......前面部分请点击上面链接看原文(原文7833字)
一、RDS或RData格式文件
........
二、CSV或TXT格式
........
三、Excel的格式文件
Excel文件是日常工作中最常见的数据处理软件之一,虽然有时候,我们可以将EXCEL的文件转化为更加普遍的CSV格式。尽管CSV格式在数据处理和交换中非常流行,但在处理复杂的Excel文件时,例如需要保留公式、格式或多个工作表的文件,直接读取Excel文件更为方便和高效。
Excel文件通常有两种格式:.xls
和.xlsx
。.xls
是早期的Excel版本使用的格式,而.xlsx
是从Excel 2007版本开始使用的更新格式。.xlsx
格式基于XML标准,支持更大的数据容量和更复杂的格式设置。
.xls (Excel 97-2003格式) | .xlsx (Excel 2007及之后格式) | |
---|---|---|
文件扩展名 | .xls | .xlsx |
文件结构 | 二进制格式 | 基于XML的压缩文件格式 |
最大行数 | 65,536行 | 1,048,576行 |
最大列数 | 256列 | 16,384列 |
文件大小限制 | 通常较小(约2GB) | 较大(理论上无实际限制) |
支持的单元格样式 | 限制较多,样式功能较少 | 支持更多样式和格式 |
公式支持 | 支持基本公式和一些函数 | 支持更复杂的公式和更多函数 |
图表支持 | 支持基本图表 | 支持更多图表类型和图表功能 |
数据验证 | 基本的数据验证功能 | 支持复杂的数据验证和条件格式 |
跨平台兼容性 | 较差,可能需要转换为其他格式 | 更好,广泛支持于各种应用和平台 |
读取/写入支持 | 老旧版本的Excel和其他软件通常支持 | 大多数现代应用程序和库支持 |
使用环境 | 旧版Excel(2003及之前版本) | 新版Excel(2007及之后版本) |
安全性 | 较低,易受潜在风险影响 | 提供更好的数据保护和加密选项 |
openxlsx
包简介
openxlsx
包是R中用于读取、写入和格式化Excel文件的工具。与其他Excel处理包相比,openxlsx
包不依赖于Java,操作更为简洁高效,支持多种Excel格式的读写。在使用openxlsx
包之前,需要首先安装并加载该包。可以通过以下命令安装并加载openxlsx。
install.packages("openxlsx")
library(openxlsx)
要读取Excel文件中的数据,可以使用read.xlsx()
函数。这个函数允许我们将Excel文件中的数据导入到R的data.frame
中进行进一步分析。read.xlsx()
函数的基本语法如下:
read.xlsx(file, sheet = 1, colNames = TRUE, rowNames = FALSE)
file
:指定Excel文件的路径。
sheet
:指定要读取的工作表编号或名称。默认值是1,表示第一个工作表。
colNames
:逻辑值,指示是否将第一行作为列名。默认为TRUE。
rowNames
:逻辑值,指示是否将第一列作为行名。默认为FALSE。
假设我们有一个名为frmgham.xlsx
的Excel文件,其中第一个工作表包含我们需要的数据(Excel文件可以包含多个工作表,这点一定要注意)。我们可以使用以下代码将其读取到R中:
# 读取Excel文件中的第一个工作表
frmgham <- read.xlsx("frmgham.xlsx", sheet = 1)
# 查看数据框的前几行
head(frmgham)
除了读取Excel文件,openxlsx
包还支持将数据写入Excel文件。我们可以使用write.xlsx()
函数将数据框保存为Excel文件。继续使用之前读取的数据框frmgham
,我们可以将其保存为一个新的Excel文件Myfrmgham.xlsx。
# 将数据框写入新的Excel文件
write.xlsx(frmgham, "Myfrmgham.xlsx")
# 查看文件保存成功的消息
cat("数据已成功保存到 Myfrmgham.xlsx 文件中。\n")
........
欢迎订阅我们专栏,深度系统地学习R语言。
为帮助大家更出色地掌握临床统计、数据挖掘以及人工智能建模的入门知识和应用,由于众多同学在计算机编程上经验欠缺,特此开设《用R 探索医药数据科学》专栏。该专栏每周至少会定期更新三篇,直到整个专栏更新完成。每篇文章都在 5000 字以上,质量平均分高达 94 分。还要提醒大家的是,每结束一个章节,专栏的优惠力度就会减小,当下正是订阅的最佳优惠时段,诚邀各位积极订阅!
专栏《用R 探索医药数据科学》链接:https://blog.csdn.net/2301_79425796/category_12729892.html?spm=1001.2014.3001.5482