R语言数据结构(三)数据框

数据结构是指在计算机中存储和组织数据的方式,不同的数据结构有不同的特点和适用场景。R语言中的常用数据结构,包括向量、矩阵、数组、列表和数据框。关于数据结构的使用,我们将分四篇文章分别介绍每种数据结构的操作方法和代码示例。

为方便大家理解记忆,对每种数据结构的基本操作概括为四大类:

  1. 创建数据结构
  2. 往里面添加数据
  3. 从里面查询数据
  4. 对里面的数据进行修改

这篇文章我们将介绍数据框的使用

目录

数据框

创建数据框

访问数据框

修改数据框

合并数据框

删除数据框


数据框

数据框是R语言中的一种类似于表格的数据结构,它是由一系列相同长度的向量组成的有序集合。数据框有两个维度,分别表示行数和列数,可以用dim()函数来获取。数据框中的每个向量可以有一个名称,可以用names()函数来获取或设置。数据框中的每个向量可以是不同的类型,但同一列的元素必须是相同的类型。

创建数据框

创建数据框的一种常用方法是使用data.frame()函数,它可以将多个向量组合成一个数据框。data.frame()函数的参数有:

  • ...: 这些参数可以采用valuetag = value的形式。组件名称将基于tag(如果存在)或被解析的参数本身。
  • row.names: 可以是NULL、单个整数或字符字符串,用于指定用作行名的列,或者是字符或整数向量,提供数据框的行名。
  • check.rows: 若为TRUE,则会检查行的长度和名称是否一致。
  • check.names: 逻辑值。若为TRUE,则会检查数据框中变量的名称,以确保它们是符合语法规范的变量名称且不重复。必要时,会进行调整(通过make.names函数)。
  • fix.empty.names: 逻辑值,指示是否为“未命名”的参数(指的是未被正式命名为someName = arg的参数)自动生成一个名称,还是使用名称""。即使check.names为FALSE,如果要保留""作为名称,也需要将此参数设置为FALSE。
  • stringsAsFactors: 逻辑值,指定是否将字符向量转换为因子向量。在R 4.0.0之前,默认设置是TRUE,但现在已更改为FALSE。

例如:


df1 <- data.frame(name = c("Alice", "Bob", "Charlie"), 
                  age = c(20, 25, 30), 
                  gender = c("F", "M", "M"))
df1
#      name age gender
# 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值