下面内容摘录自《用R探索医药数据科学》专栏文章的部分内容。
1)栏目后续章节的文章将深入概括R语言在临床研究和新药创新领域的应用,填补了国内R教材中尚未广泛覆盖的部分内容。
2)专栏每篇文章都在 5000 字以上,质量平均分高达 94 分。已发表章节也会增加新的文章,已发表的文章也会更新版本,可留意专栏内容和题目信息。
3)由于每结束一个章节,专栏的优惠力度就会减小,当下正是订阅的最佳优惠时段,诚邀各位积极订阅!看全文请点击下面链接。
欢迎订阅我们专栏
.......前面部分请点击上面链接看原文(原文7833字)
一、RDS或RData格式文件
........
二、CSV或TXT格式
........
三、其它格式
在数据分析和处理过程中,我们经常需要读取和写入各种不同格式的数据文件,包括由其他统计软件如SPSS、SAS、Stata、Minitab等产生的数据文件。本文将详细介绍如何在R中使用各种函数和扩展包来处理这些文件格式,帮助读者更高效地进行数据处理和分析。
一种方法是先将其他统计软件中的数据导出为文本文件,如CSV或TXT格式,然后再使用R的read.table()
或read.csv()
函数将数据读入R中。这种方法虽然简单,但可能会遇到数据格式不一致、编码出错等问题。也可以使用其它的R扩展包。
1、使用foreign
包
foreign
包提供了一套函数,用于直接读取和写入其他统计软件的数据文件,包括SPSS、SAS、Stata等。该包极大地方便了不同软件之间的数据交互,减少了数据转换的麻烦和错误。例如,对于SAS数据文件,即后缀名为.ssd的数据文件,可通过包内的read.ssd()
函数来读取。对于SPSS数据文件,即后缀名为.sps的数据文件,可通过包内的read.spss()
函数来读取。对于Stata数据文件,即后缀名为.dta的数据文件,可使用foreign
包的read.dta()
函数实现。
同样,如果我们要把数据frmgham
分别保存为SAS、SPSS和Stata数据文件,可使用以下代码,生成文件,并把相关文件分别保存在工作目录文件下(如果需要保存到其它的位置,可以设置文件的路径)。
# 加载foreign包
library(foreign)
# 保存为SPSS文件
write.foreign(frmgham, "frmgham2.txt", "frmgham2.sps", package = "SPSS")
# 保存为SAS文件
write.foreign(frmgham, "frmgham2.txt", "frmgham2.sas", package = "SAS")
# 保存为Stata文件
write.foreign(frmgham, "frmgham2.txt", "frmgham2.dta", package = "Stata")
其它格式文件读取的汇总
文件格式 | 使用的函数 | R扩展包 |
---|---|---|
ERSI ArcGIS | read.shapefile | shapefiles |
Matlab | readMat | R.matlab |
Minitab | read.mtp | foreign |
SAS(.ssd) | read.ssd | foreign |
SAS(.xport) | read.xport | foreign |
SPSS | read.spss | foreign |
Stata | read.dta | foreign |
Systat | read.systat | foreign |
# 1.1 SPSS文件 (.sav)
# 安装和加载foreign包
install.packages("foreign")
library(foreign)
# 读取SPSS数据文件
data_spss <- read.spss("data.sav", to.data.frame = TRUE)
# 1.2 SAS文件 (.sas7bdat, .xpt)
# 读取SAS数据集文件
data_sas <- read.ssd("data.ssd")
# 读取SAS传输文件
data_xport <- read.xport("data.xpt")
# 1.3 Stata文件 (.dta)
# 读取Stata数据文件
data_stata <- read.dta("data.dta")
# 1.4 Minitab文件 (.mtp)
# 读取Minitab数据文件
data_minitab <- read.mtp("data.mtp")
# 1.5 Matlab文件 (.mat)
# 安装和加载R.matlab包
install.packages("R.matlab")
library(R.matlab)
# 读取Matlab数据文件
data_matlab <- readMat("data.mat")
# 1.6 ERSI ArcGIS文件
# 安装和加载shapefiles包
install.packages("shapefiles")
library(shapefiles)
# 读取shapefile
data_shapefile <- read.shapefile("data.shp")
# 1.7 Systat文件
# 读取Systat数据文件
data_systat <- read.systat("data.sys")
# 1.8 R.matlab文件
# 安装和加载R.matlab包
install.packages("R.matlab")
library(R.matlab)
# 读取Matlab数据文件
data_matlab <- readMat("data.mat")
........
欢迎订阅我们专栏,深度系统地学习R语言。
为帮助大家更出色地掌握临床统计、数据挖掘以及人工智能建模的入门知识和应用,由于众多同学在计算机编程上经验欠缺,特此开设《用R 探索医药数据科学》专栏。该专栏每周至少会定期更新三篇,直到整个专栏更新完成。每篇文章都在 5000 字以上,质量平均分高达 94 分。还要提醒大家的是,每结束一个章节,专栏的优惠力度就会减小,当下正是订阅的最佳优惠时段,诚邀各位积极订阅!
专栏《用R 探索医药数据科学》链接:https://blog.csdn.net/2301_79425796/category_12729892.html?spm=1001.2014.3001.5482