- 博客(8)
- 资源 (4)
- 收藏
- 关注
原创 小白读《R语言实战》写的读书笔记(第八章)
而向前向后逐步回归(stepwise stepwise regression,通常称作逐步回归,以避免听起来太冗长),结合了向前逐步回归和向后逐步回归的方法:变量每次进入一个,但是每一步中,变量都会被重新评估,对模型没有贡献的变量将会被删除;当只有一个预测变量,但同时包含变量的幂(如X²,X³)时,称为多项式回归。#在states的多元回归模型中,我们发现Income和Frost 的回归系数不显著,此时我们可以检验不含这两个变量的模型与包含这两项的模型的预测效果是否一样好(见代码清单8-9)。
2024-04-02 14:43:03 901
原创 小白读《R语言实战》写的读书笔记(第七章)
虽然前面的示例使用的是mystats()函数,但我们也可以使用Hmisc和psych包中的describe()函数或者pastecs包中的stat.desc()函数。#可以使用margin.table()或prop.table()生成边际频数和比例:(这里的边际频数指的是按照行或列分组时的每一组的总频数,John注)#这里可以插入的函数有mean(),sd(),var(),max(),median(),length(),range()和quantile()
2024-03-19 20:16:28 769
原创 小白读《R语言实战》写的读书笔记(第六章)
summarize(n = n(), #n = n,第2个n是state.region中的观察数目,在本例中表示有几个地区,第1个n是将这个结果新建一个名称为n的列。ggplot(plotdata, aes(x = reorder(state.region, mean), y = mean)) + #绘制均值的排序条形图。se = sd(Illiteracy)/sqrt(n)) #计算标准误,sqrt(n)代表根号n,标准误=标准差/根号样本量。
2024-03-06 14:08:43 383
原创 小白读《R语言实战》写的读书笔记(第四章)
scale_x_continuous(breaks = seq(0, 60, 10)) + #更改代表工作年限的x轴的范围从0到60,每个格子为10。scale_y_continuous(breaks = seq(0, 30, 5)) + #更改代表薪资的y轴的范围从0到30,每个格子为5。geom_smooth() #拟合曲线 ##选项有:method, formula, color, fill, linetype, size。
2024-02-15 14:07:44 395
原创 小白读《R语言实战》写的读书笔记(第三章)
含义 <- c("数字表示日期(0-31)", "缩写的星期名", "非缩写的星期名", "月份(01-12)", "缩写的月份", "非缩写的月份", "两位数的年份", "四位数的年份")示例 <- c("01-31", "Mon", "Monday", "00-12", "Jan", "January", "07", "2007")符号 <- c("%d", "%a", "%A", "%m", "%b", "%B", "%y", "%Y")
2024-02-15 14:06:07 369
原创 小白读《R语言实战》写的读书笔记(第二章)
比如说,colClasses=c("numeric","numeric","character","NULL",“numeric")把前两列读取为数值型变量,把第三列读取为字符型向量,跳过第四列,把第五列读取为数值型向量。#vector是数组中的数据,dimensions是一个数值型的向量,给出了各维度的最大值,dimnames是可选的、各维度名称标签列表。y
2024-02-15 14:04:07 376
原创 小白读《R语言实战》写的读书笔记(第一章)
sink()函数只用于文本输出,示例:sink(file = NULL, append = FALSE, type = c("output", "message"),split = FALSE)apropos("foo", mode="function") #列出名称中含有foo的所有可用函数。save.image("myfile") #保存工作空间到文件myfile中(默认值为.Rdata)help.search("foo") #以foo为关键词搜索本地帮助文档,或表达式为?
2024-02-15 14:02:19 364
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人