R数据科学-内容小结

本文是对《R数据科学》一书的部分章节总结,涉及tibble的创建与特性,readr的数据导入方法,dplyr的关系数据处理,stringr的字符串操作,forcats的因子处理,以及lubridate对日期和时间的管理。内容涵盖数据框转换、文件读取、数据连接、正则表达式应用、因子操作及日期时间处理等核心概念。
摘要由CSDN通过智能技术生成

最近在看《R数据科学》这本书,由于报告的需要,对其中部分章节进行了总结

第七章:使用tibble实现简单数据框

1、创建tibble

  • as_tibble():数据框转换成tibble
  • tibble()创建:使用向量,可以使用非法列名
  • tribble()创建:定制化

2、tibble与data.frame的不同(即简单数据框和传统数据框)

  • 在打印和取子集方式上有所不同
  • 打印:Tibble默认只打印前10行,并且显示数据类型
  • 取子集:$按名称提取,[[按名称或位置提取,其中tibble不能部分匹配

 

第八章:使用readr进行数据导入

  1. read_csv():读取逗号分隔的文件
  • 第一个参数是读取的文件的路径
  • 一般使用第一行作为列名称,使用skip=n跳过前n行;使用comment=’#’来丢弃以#开头的行
  • 参数col_names可以控制列名称
  • “\n”用于添加新行
  • 参数na设定使用哪些值表示缺失值

2

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值