R语言基础!!!

读取csv文件
read.table函数:read.table函数以数据框格式读入数据,所以适合读取混合模式的数据,但是要求每列的数据类型相同。
read.table读取数据非常方便,通常只需要文件路径、URL或连接对象就可以了,也接受非常丰富的参数设置:

  • file参数:这是必须的,可以使相对路径或者是绝对路径(注意:Windows下的要用/或者\)
    header参数:默认为FALSE即数据框的列名为V1,V2…,设置为TRUE时第一行作为列名。
    sep参数:分隔符,默认为空格。可以设置为逗号(comma)sep=’,’,分号(semicolon)sep=’;'和制表符(tab)。
    read.csv、read.csv2、read.delim是read.table函数的包装,分隔符分别对应逗号,分号,制表符,同样接受read.table所有参数。
    read.csv函数header参数默认为TRUE,不同于read.table。
    字符型数据读入时自动转换为因子,因子是R中的变量,它只能取有限的几个不同值,将数据保存为因子可确保模型函数能够正确处理。But当变量作为简单字符串使用时可能出错。要想防止转换为因子:1.令参数stringAsFactors=FALSE,防止导入的数据任何的因子转换。2.更改系统选项options(stringsAsFactors=FALSE)3.指定抑制转换的列:as.is=参数。通过一个索引向量指定,或者一个逻辑向量,需要转换的列取值FALSE,不需要转换的列取值TRUE。
data5<-read.csv('item.csv', stringAsFactors=FALSE)

具体见:R语言参数设置
第一种读法:

getwd()#"C:/Users/Administrator/Documents"查找R的工作区目录
setwd("C:/Users/Administrator/Documents")#建立R的新的工作区目录
data<-read.csv("dazhonginfo.csv")#将文件放入工作区目录下,然后直接读取文件

第二种读法:

data<-read.csv("C:/Users/Administrator/Desktop/dazhonginfo.csv")
is.data.frame(data)#True是否是数据框
ncol(data)#列数
nrow(data)#行数
sal<-max(data$environmentScore)#求data数据的environmentScore列的最大值
#使用条件获取符合条件特定的行,类似于SQL中的where语句
retval <- subset(data, environment == max(environment))
city1 <- subset(data, city == "大连")

建立数据框

df1 = data.frame(name = c("aa", "bb", "cc"), age = c(20, 29, 30),sex = c("f", "m", "f"))
df2 = data.frame(name = c("dd", "cc", "bb"), age = c(40, 35, 36), sex = c("f", "m", "f"))
mergedf = merge(df1, df2, by = "name")#merge函数从两个数据框中选择条件相等的
#行组成一个新的数据框

结果展示

#subset函数从某一个数据框中选择出符合某条件的数据或是相关的列
#(1)单条件查询
selectresult = subset(df1, name == "aa")
#(2)指定显示列
selectresult = subset(df1, name == "aa", select = c(name,sex))
#(3)多条件查询
selectresult = subset(df1, name == "aa" & sex == "f",select = c(age, sex))

R语言常用得基本函数:R语言的基本函数、统计量及其用法

sum/mean/sd/min
which.min()#找出最小值的序号
#多元数据
colMean()#每列,row是行(横向)
colnames()#列名
colSums()#求列和
cov()#协方差矩阵
cor()#相关矩阵
cor.test()#相关系数

R语言中cbind和rbind的区别
cbind:根据列进行合并,即叠加所有列,m列的矩阵与n列的矩阵最后叠加为m+n列,合并前提:cbind(a,c)中的矩阵a、c的行数必须相符。
rbind:根据行进行合并,就是行的叠加,m行的矩阵与n行的矩阵最后变成m+n行的矩阵,前提是:rbind(a,c)中的矩阵a、从、的列数必须相符。
logistic回归分类:

head(iris)#鸢尾花数据的前六行
iris2 = rbind(subset(iris, Species == 'setosa'), subset(iris, Species == 'versicolor'))
X <- cbind(rep(1, nrow(iris2)), iris2$Sepal.Length, iris2$Sepal.Width, iris2$Petal.Length, iris2$Petal.Width)

R语言自带的数据包
logistic回归分类
在这里插入图片描述

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值