R读取数据

一、文本格式
1、csv文本格式(即逗号分隔文件):
> data<-read.csv("D:\\work\\data\\1.csv",header = F)
#说明:header = T(TURE)是默认状态,有标题栏,可修改为F(FALSE)。

2、txt文本格式:
> data<-read.table("D:\\work\\data\\1.txt",quote=F,header = T)
#说明:quote=F表示引号不读取。

3、读取剪贴板中数据:
> data <- read.table("clipboard", header = T, sep = '\t')
#说明:sep="\t" 表示以tab(制表符)为分隔符。
> mydata <- read.delim("clipboard")
#说明:复制excel表格时使用。

#说明:encoding='utf-8'可能可以解决读取中文乱码的问题。

二、excel文件:
1、程序包RODBC
> library(RODBC)
> z <- odbcConnectExcel("c:/data/body.xls")
> foo <- sqlFetch(z, "Sheet1")
> close(z)
#说明:64位系统不能正确使用,可能是由于excel所用access不是64位的和缺少相应的java环境,连接不上。

2、程序包XLconnect
>install.packages('XLConnect')
>library(XLConnect)
>xls <- loadWorkbook('d:/数据分析/R/4.xlsx')
>readWorksheet(xls, '统计表')
#说明:建立连接时,必须输入文件的绝对路径

3、程序包xlsx
>library(xlsx)
>read.xls("body.xlsx",sheetName="nba",header=T)
#说明:注意文件路径、编码等问题。

4、程序包readxl
>install.packages("readxl")
>read_excel("my-spreadsheet.xls", sheet="data")
#说明:sheet="data"或者sheet=2(位置)。

5、程序到openxlsx
>install.packages("openxlsx", dependencies=TRUE)
>readWorkbook(xlsxFile, sheet = 1, startRow = 1, colNames = TRUE,
   rowNames = FALSE, detectDates = FALSE, skipEmptyRows = TRUE,
   skipEmptyCols = TRUE, rows = NULL, cols = NULL, check.names = FALSE,
   namedRegion = NULL, na.strings = "NA", fillMergedCells = FALSE)
#说明:对大的数据量效果好。

三、不规则文本格式读取:
1、编码:非-ASCII字符字段,要确保以正确的编码方式读取。encoding="latin1/utf-8"。
2、首行:header = TRUE/T。
3、分隔符: sep = "\t"(\t为制表符分割),也可以是其他任何符号,等。
4、缺失值:NA表示缺失,na.strings表示字符串,NaN,Inf和-Inf表示数值列。
5、忽略尾部空字段: fill = TRUE。
6、忽略中间空字段:blank.lines.skip = FALSE,fill = TRUE。
7、变量类型:as.is 会抑制字符向量转换成因子(仅此功能);colClasses运行为输入中的每个列(非每个变量),对标签列同样适用。
8、注释:注释符#后该行会被忽略,当作空白行。要读取可用comment.char = ""(读取速度也会加快)。
9、"\"终止字符。
10、读大的数据格子(data grid)时,效率最重要。设定 comment.char = "",以原子向量类型(逻辑型,整型,数值型,复数型,字符型或原味型)设置每列的colClasses ,给定需要读入的行数 nrows (适当地高估一点比不设置这个参数好)等措施会提高效率。
11、参数列表:file,header,sep,quote,dec,row.names,col.names,as.is,na.strings,colClasses,nrows,skip,check.names
fill,strip.white,blank.lines.skip,comment.char。

四、读取spss(sav)/sas(xport/ssd)数据:
1、程序包foreign
>install.packages("foreign")  
>library(foreign)  
>tempdata=read.spss("dataname.sav")  
#说明:文件名不能超过8个字符,变量名长于8字符会被截断。

2、程序包Hmisc
>install.packages("Hmisc")  
>library(Hmisc)  
>tempdata=spss.get("dataname.sav")  

3、程序包memisc
>install.packages("memisc")  
>library(memisc)  
>tempdata0<-as.data.set(spss.system.file("D:/dataname.sav"))
>tempdata<-as.data.frame(tempdata0)
#说明:程序包foreign与Hmisc对SPSS格式兼容不太好,尤其是变量名有中文或不规则字符串时。

4、新程序包sas7bdat.parso

五、学习资料及程序包地址:
1、R官方地址:http://www.r-project.org/
2、R开发者论坛:http://r.789695.n4.nabble.com/
3、CRAN:http://cran.rstudio.com/
4、RForge:https://r-forge.r-project.org/

六、R的演进及功能块:
1、RevolutionAnalytics公司的RHadoop产品,让R可以直接调用Hadoop集群资源
2、RStudio公司的RStudio产品,给了我们对于编辑软件新的认识
3、RMySQL, ROracle, RJDBC 打通了R和数据库访问通道
4、rmongodb, rredis, RHive, rhbase, RCassandra 打通过R和NoSQL的访问通道
5、Rmpi, snow 打通了单机多核并行计算的通道
6、Rserve,rwebsocket 打通了R语言的跨平台通信的通道
7、R不仅是学术界的语言,更将成为工业界必备的语言。
  • 3
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 要在RStudio中读取数据,可以使用以下几种方法: 1. 使用read.table()或read.csv()函数读取文本文件或CSV文件。例如,要读取名为data.txt的文本文件,可以使用以下代码: ``` data <- read.table("data.txt", header = TRUE) ``` 2. 使用read_excel()函数读取Excel文件。要使用此函数,您需要安装readxl包。例如,要读取名为data.xlsx的Excel文件,可以使用以下代码: ``` library(readxl) data <- read_excel("data.xlsx") ``` 3. 使用readRDS()函数读取RDS文件。RDS文件是一种保存R对象的二进制文件。例如,要读取名为data.rds的RDS文件,可以使用以下代码: ``` data <- readRDS("data.rds") ``` 这些是读取数据的基本方法,您可以根据您的数据类型和格式选择适当的方法。 ### 回答2: RStudio是一款功能强大的集成开发环境(IDE),广泛用于数据分析和统计建模。在RStudio中,我们可以使用不同的函数和包来读取各种类型的数据。 一种常见的数据类型是CSV(逗号分隔值)文件。要从CSV文件中读取数据,可以使用`read.csv()`函数。该函数接受文件路径作为参数,并返回一个数据框,其中包含从CSV文件中读取的数据。 例如,假设我们有一个名为"data.csv"的文件,其中包含有关一些学生的信息,如姓名、年龄、成绩等。要读取这个CSV文件,可以使用以下代码。 ``` data <- read.csv("data.csv") ``` 读取完成后,数据将被存储在名为"data"的数据框中。你可以使用`head()`函数来查看数据的前几行,或者使用`summary()`函数来获取数据的概要统计信息。 除了CSV文件,RStudio还可以读取其他常见的数据格式,如Excel文件、SQL数据库、文本文件等。RStudio提供了许多专门用于读取这些数据格式的函数和包。例如,要读取Excel文件,可以使用`readxl`包中的函数`read_excel()`。要读取SQL数据库,可以使用`dbReadTable()`函数(需要安装和加载适当的数据库驱动程序和连接)。 总结来说,RStudio提供了多种方法来读取各种数据格式的数据。无论是常见的CSV文件,还是Excel文件、SQL数据库等,你都可以使用适当的函数和包来读取数据,并进行后续的数据分析和处理。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值