R语言之data.frame

  1. data frame之于matrix,就像list之于vector,像是一个升级版,(一行)可以存储多种类型的数据(即每一列的数据类型可以不同)
  2. data frame的创建:

    kids<-c(“Jack”,”Jill”)

    ages<-c(12,10)

    d<-data.frame(kids,ages,stringsAsFactors=FALSE)

  3. data frame创建:数据框(Data frame) 前面我们已经看到一个数据框可以由函数read.
       table 间接创建;这里也可以用函数data.frame来创建。数据框中的向
       量必须有相同的长度,如果其中有一个比其它的短,它将“循环”整数
       次(以使得其长度与其它向量相同):
    > x <- 1:4; n <- 10; M <- c(10, 35); y <- 2:4
    > data.frame(x, n)
    x n
    1 1 10
    2 2 10
    3 3 10
    4 4 10
    > data.frame(x, M)
    x M
    1 1 10
    2 2 35
    3 3 10
    4 4 35

  4. data frame中元素的创建

    1) d[[index]]

    2) d$column_name 根据列名取出所在的列,如果有na那么可以用na.omit去除na值,然后进行操作

    3) d[,index]:访问第index列

    4) d[index,]:访问第index行

    5) d[[a:b]]:访问第a列的第b个元素

    6) d[a:b]:对data frame提取a列到b列来构成子frame。

  5. 对于data frame,依然可以在[]内写表达式来做过滤
  6. 如list的可扩展性一样,data frame也可以“扩展”——通过rbind增加行,通过cbind增加列(也可以通过d$newColumn<-c(aaa,bbb)这样来添加一个名为newColumn的列)
  7. merge方法可以合并两个data frame,类似于sql中的join
  8. lapply()可以将指定的方法f()作用于data frame的各个列
转自:http://datawarehou.se/knowledge/the-art-of-r-5/ 
`data.frame`是R语言最常用的结构之一,用于组织数据集。它类似于表格或数据库的行和列形式,主要用于统计分析、数据可视化等任务。以下是关于`data.frame`的一些基本特性: ### 数据帧的主要特点: 1. **双维结构**:`data.frame`是一个二维表型的数据结构,每一行代表一条观测记录,而每列表示一个变量。 2. **异构支持**:`data.frame`可以容纳不同类型的数据,并将它们放在不同的列,例如数字、字符串、日期时间或其他类型的向量。 3. **命名属性**:每个变量(列)都有名称,这使得引用特定变量变得简单明了,无需像数组那样通过索引来访问。 4. **列顺序自由**:虽然有名称,但列的物理顺序并不是固定的,可以根据需要重新排列。 5. **灵活的操作**:支持多种内置函数操作,如合并、筛选、排序、分组聚合等,方便数据分析流程。 6. **兼容性好**:几乎所有的R包都支持数据帧作为输入和输出,使得数据处理和分析非常便捷。 ### 创建`data.frame`的基本语法: ```r df <- data.frame( column1 = c(1, 2, 3), column2 = c("apple", "banana", "cherry"), row.names = c(1L, 2L, 3L) ) # 或者使用现有的数据向量直接创建数据框 df <- data.frame(column1 = c(1, 2, 3), column2 = c("a", "b", "c")) ``` ### `data.frame`的常用操作: - **获取信息**:`str()`查看数据框架的结构;`dim()`查看行列数。 - **选择元素**:`df$column_name`选取某一列;`df[row_index, ]`或`df[, col_index]`分别选取指定行或列。 - **修改元素**:`df$column_name <- new_values` - **连接数据**:使用`merge()`函数与其他数据帧连接。 - **过滤数据**:`subset(df, condition)`基于条件筛选数据。 ### 相关问题: 1. 怎样在R对`data.frame`进行排序? 2. R的`data.frame`如何进行合并? 3. `data.frame`如何处理缺失值(NA)? 这样的问答可以帮助理解和应用`data.frame`这一强大的工具在R编程的实际场景。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值