R语言学习-----访问变量处理数据库子集

最新推荐文章于 2022-11-27 18:16:24 发布

babyfaceou

最新推荐文章于 2022-11-27 18:16:24 发布

阅读量1.3k

点赞数 2

分类专栏： R语言文章标签： R 数据库子集变量访问编程

本文链接：https://blog.csdn.net/babyfaceou/article/details/90452271

版权

R语言专栏收录该内容

6 篇文章 6 订阅

订阅专栏

上集回顾

上一节我们学了数据中的载入方式，也就是各种格式的数据放入excel中，然后生成制表符分隔的文本文档，再再RStudio中用read.table(file= , header=TRUE)或者scan(file= , what='c')来读取到R中。

访问数据库变量

R不只是可以用来做可视化，也是分析数据处理数据的神兵利器，这样，从原始数据载入到数据分析处理，再到出图呈现归路都在R中实现，选择R真没错！
我们学习的样本还是前面用过的鱿鱼数据，我们重新导入鱿鱼数据并用names（数据框）来查看我们正在处理的变量：

在这里插入图片描述

str函数 str(数据库)
str函数用来查看数据框中每个变量的属性。查看变量属性是否和自己预期的一样十分重要，这避免了很多的数据导入混乱。要始终将read.table names str三个函数结合使用。

在这里插入图片描述
函数中的数据参数

M1 <- lm(GSI ~ factor(Location) + factor(Year), data = Squid)，举这个例子说明函数和参数用法。一般是先根据要分析的操作确定一个函数，如线性回归函数lm，然后告诉函数在找数据，如data = Squid。并不是所有的函数都有data参数，如果有就使用。

$符号
对于没有data参数的函数，可以有下面两种方法访问变量：

使用 $：如 ‘ S q u i d$ GSI`访问了其中GSI列的数据。
Squid[,6]有同样的作用

其中，使用前者可以避免一段时间后忘记访问的是什么数据。注意，有些函数并不支持第一种访问方法。
在这里插入图片描述

attach函数
使用attach函数是个有利有弊的举措，attach函数可以把变量添加到R搜索路径里，这样的话就可以直接使用每一个函数而直接用这个变量命来访问。但是如果这个变量名和函数名称或者别的数据框的变量名重复的话，则会产生问题。因此，在使用attch时要注意几点：

不要输入attach（同一个变量）两次，避免复制变量。
确保attach使用唯一的变量名称，避免用月份、位置等。
合理使用detach移除R搜索路径里的数据框。

习题一：使用流行病数据练习使用read.table函数并访问数据框里的变量
处理excel文件要注意空格问题以及数据格式等。
在这里插入图片描述
但是在完成后面的要求的时候产生了问题，后面要求按年份统计流感病例，但是我导入数据的时候把年份那个行删除了。但是保留的话，因为头行是下面数据的一半，导入会报错：