r 数据读取

一、按路径读取
data <- read.csv('C:/Users/Administrator/Desktop/xx.csv') 
二、先设置工作目录(推荐)
setwd("C:/Users/Administrator/Desktop") #直接设置工作目录,路径:files》more》set as working directory


1、csv文本格式(即逗号分隔文件):
 data<- read.csv("xx.csv",header = F,fileEncoding ="utf-8")


2、txt文本格式:
 data<- read.table("xx.txt",quote=F,header = T)
#说明:quote=F表示引号不读取。


3、链接mysql数据库http://blog.csdn.net/cao812755156/article/details/48737337
library(RODBC)  #包
channel <- odbcConnect("bluemoon", uid="paidan", pwd="dan.690.Zjk",DBMSencoding="UTF8")  #data source name、user、password、预防中文乱码,ODBC中的details-character set也要设置为UTF8
sqlTables(channel)  #查表
data<-sqlFetch(channel,"表")#读取表中数据
 sqlQuery(channel,"select * from 表")


三、不规则文本格式读取:
1、编码:要确保以正确的编码方式读取fileEncoding ="utf-8"(首选)或者encoding ="utf-8"
2、首行:header = T(TURE)是默认状态有首行,可修改为F(FALSE)表示不读首行。
3、分隔符: sep = "\t"(\t为制表符分割),也可以是其他任何符号,等。
4、缺失值:NA表示缺失,na.strings表示字符串,NaN,Inf和-Inf表示数值列。
5、忽略尾部空字段: fill = TRUE。
6、忽略中间空字段:blank.lines.skip = FALSE,fill = TRUE。
7、变量类型:as.is 会抑制字符向量转换成因子(仅此功能);colClasses运行为输入中的每个列(非每个变量),对标签列同样适用。
8、注释:注释符#后该行会被忽略,当作空白行。要读取可用comment.char = ""(读取速度也会加快)。


四、基本操作


View(data)#查看数据


#查看数据表前10行
head(data,n=10)


#显示数据表后10行
tail(data,n=10)




#查看data表中的loan_amnt字段
data$loan_amnt


#查看贷款金额列数据类型
typeof(data$loan_amnt)


Read more: http://bluewhale.cc/2016-10-12/use-r-to-read-and-view-the-data.html#ixzz4xL2oBMCC
#更改贷款金额字段为integer型,使用as.integer函数将贷款金额字段由之前的double型改为integer型。
data$loan_amnt=as.integer(ldata$loan_amnt)


桌面导入.csv数据到数据框myframe
file <- "C:/Users/Administrator/Desktop/TEST.csv"
myframe <- read.csv(file, header = TRUE, sep = ",")
myframe[1:10,]  #查看你导入的数据前10行
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值