学习R语言第五天

语法学习

创建数据的方式


dose <- c(20,30,40,50)

drugA <- c(16,29,20,30)

创建了俩个数据我们可以把数据输出一下看一下数据格式

在这里插入图片描述

绘制图形的方式


plot(dose,drugA,type="b",lty=3,lwd=3,pch=15,cex=2)

在这里插入图片描述
参数含义
type= ”b“ 同时绘制点和线的方式
dose 在x坐标的方式
drugA 在y坐标点方式

lwd = 3 设置线的宽带的方式

cex =1 指定 符号的大小

图形添加颜色

lines(dose,drugA,type = "b",pch=17,lty=2,col="blue")

在这里插入图片描述

col=“blue” 添加颜色的方式

lty =1 指定线条的类型

如何操作数据的方式

准备基础数据

manager <- c(1,2,3,4,5)
data <-c("10/20/28","10/20/27","10/20/26","10/20/25","10/20/01")
country <- c("US","UC","UD","UW","UE")
gender <- c("W","N","E","B","L")
age <- c(23,34,64,64,55)
q1 <- c(1,34,5,6,7)
q2 <- c(1,34,5,6,7)
q3 <- c(1,34,5,6,1)
q4 <- c(1,34,5,NA,5)
q5 <- c(1,34,5,NA,8)

# 把数据放入到数据库框中的方式
leadership <- data.frame(manager,
data,
country,gender,age,q1,q2,q3,q4,q5
,stringsAsFactors = FALSE)

数据框中输出的数据信息
在这里插入图片描述

数据进行验算的

# 对数据进行运算的方式
sumData <- leadership$q2+leadership$q1

这里需要给q1 和q2 中添加数据才可以
在这里插入图片描述

判断加付值的方式

age 等于99 设置为 NA

leadership[leadership$age == 99] <- NA

基本练习

leadership[leadership$age > 75] <- "Elader"


leadership[leadership$age >= 55 & leadership$age <=75] <- "Elader"

leadership[leadership$age < 66] <- "Youd"

修改变量名称的方式


fix(leadership)

弹出一个数据框我们可以直接在上面编辑
在这里插入图片描述
我们修改了第二列的名称为tesDate01


names(leadership)[2] <- "testDate01"

在这里插入图片描述

判断是否存在缺失值

y <- c(1,2,3,NA)
is.na(y)

true 说明存在缺失值
在这里插入图片描述

在计算的方式忽略缺失值


y2 <- sum(y,na.rm =TRUE)

通过函数的方式忽略缺失值

test02 <- na.omit(test01)

日期处理的方式

myDate <- as.Date(c("2003-9-09","2003-9-10"))

字符串转化成日期的方式

dates <- as.Date(strDates,"%m/%d/%Y")

格式化数据框中数据

myformat <- "%/m/%d/%y"
leadership$date <- as.Date(leadership$date,myformat)

返回当前的日期的方式

currentDate <- Sys.Date()

获取月日的方法

x <- format(toDay,"%B %d %y")

在日期上进行运算的方式

startDate <- as.Date("2023-10-10")

endDate <- as.Date("2024-10-10")

days <- endDate - startDate

# 最后计算结果是天数
days

difftime 这个函数计算结果


Date01 <- Sys.Date()
currentDate <- format(Date01,format="%Y-%d-%m")

endDate <- as.Date("2023-10-20")
endDate <- format(endDate,format="%Y-%d-%m")

currentDate

Date01

currentDate

difftime(Date01,endDate,units = weekdays())

日期转字符串的方式

t1 是日期函数

strDates <- as.character(t1)

判断是否是数值的方式

is.numeric(a)

is.vector(a)

合并俩个数据框的方式

merge 合并俩个数据框的方式

total <- merge(name,age)

查看数据框的方式

查看数据库的前三行

newData <- leadership[1:3,]

在这里插入图片描述

对数据进行栓选的方式

选择年龄大于18体重大150的

newTestDate <- testData[
  testData$age > 18
  &
  testData$weight > 120,
]
# 将选中的数据放入到体重中的方式
ccc <- subset(
  testData,
  age > 18 | age < 24,
  select = (weight)
)

使用数据库查询方式

install.packages("sqldf")

library(sqldf)

library(gsubfn)
library(proto)
library(RSQLite)
newdf <- sqldf("select * from testData where age =16")
newdf
  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
《统计学习导论》是一本经典的统计学习教材,第五章主要介绍了基于R语言的应用。R语言是一种用于数据分析和统计建模的程序语言,它具有强大的数据处理能力和丰富的统计方法库。在统计学习中,R语言常被用来进行数据预处理、模型构建和模型评估等环节。 本章首先介绍了R语言的基础知识和常用的数据结构,如向量、矩阵和数据框等。接着介绍了R语言的数据读取和处理方法,包括导入和导出数据、数据清洗和转换等操作。这些基本技能对于进行后续的统计分析和建模是非常重要的。 在进入统计学习算法之前,本章还介绍了R语言中常用的统计方法和函数。例如,线性回归、逻辑回归和决策树等方法都可以借助R语言进行实现。此外,还介绍了R语言中的交叉验证和模型选择方法,帮助用户在模型构建过程中选择最优的模型。 最后,本章通过一个实例展示了如何用R语言实现一个典型的统计学习任务。从数据的读取、预处理到模型的构建和评估,读者可以清晰地了解整个统计学习过程。通过实践,读者不仅能够掌握R语言的基本操作,还能够理解统计学习算法的原理和应用。 总之,第五章基于R答案的《统计学习导论》为读者提供了一个全面的学习R语言和应用统计学习的指南。通过学习本章内容,读者可以熟练掌握R语言的基本操作和常用统计方法,为后续的统计学习实践打下良好的基础。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值