Mac R语言.xlsx文件读取为data.frame和操作示例

最新推荐文章于 2025-03-16 17:49:02 发布

しん　い

最新推荐文章于 2025-03-16 17:49:02 发布

阅读量3.8k

点赞数 5

分类专栏： R语言mac 文章标签： r语言 mac csv

本文链接：https://blog.csdn.net/Thedottreebelow/article/details/105587773

版权

R语言mac 专栏收录该内容

1 篇文章

订阅专栏

   操作平台：Rstudio、mac
     学习R语言的时候，查询各种资料发现，R语言相对来说能查到的东西很零散，所以萌发想自己整理相应操作的想法。

读取文件

首先是读取一个.xlsx文件。其实R语言读取文件的方式很多，这里只示例xlsx文件，其他如csv文件等等，都有相应的函数。只需要更改函数后缀就好了，使用方式大概如下定义。

在这里插入图片描述
如果有读取文件要求的数据格式，可以通过class（data）的方式，来查看该变量的数据格式。（之前也是各种查询，因为我需要dataframe数据格式。发现明明就是直接一个函数的问题，偏偏一群网上的讨论，让我心累）（dataframe格式我就不在此介绍了）注意：调用类似函数，需要先安装对应的包，以及加载。

那么如何查看到底有哪些字段名称和字段个数呢（列向量）：

在这里插入图片描述

文件过滤切片

对于任意一列数据的访问，此处，首先要确定的是对于行号，0是不存在元素的，代表的是名称。在R中，对于某个列进行访问的方式，可以直接通过data$x[index];data为所储存的dataframe数据，x为某列向量的字段名，index为索引值，也就是行号（1——n）
我的作业要求是剔除一些不正常的数据

在这里插入图片描述
如第二列，日期不可能为0/0/0；
剔除这些行，我采用的是filter函数，调用的是上面加载示例的dplyr包
filter（data,xx） data自然是dataframe数据框，那么xx就是相应的检索语言。其中有两种方式：
1.直接写成DATE_R!=data$DATE_R[1]的格式，后者可以直接复制粘贴数据里的值（但注意好是否为字符串）。

2.老老实实data$DATE_R!=data$DATE_R[1]，为什么会考虑这个情况，因为有的列如果重复出现，用这个方式更加保险（R语言会变成x…ncol，同名变量，跟着列号）。
代码示例：data1=filter(data,data$DATE_R!=data$DATE_R[1])根据DATE_R列的情况作为参考，提前所有满足条件的行数（此处是Rstudio里面的情况，所以时间显示不一样）：