最近在看《R数据科学》这本书,由于报告的需要,对其中部分章节进行了总结
第七章:使用tibble实现简单数据框
1、创建tibble
- as_tibble():数据框转换成tibble
- tibble()创建:使用向量,可以使用非法列名
- tribble()创建:定制化
2、tibble与data.frame的不同(即简单数据框和传统数据框)
- 在打印和取子集方式上有所不同
- 打印:Tibble默认只打印前10行,并且显示数据类型
- 取子集:$按名称提取,[[按名称或位置提取,其中tibble不能部分匹配
第八章:使用readr进行数据导入
- read_csv():读取逗号分隔的文件
- 第一个参数是读取的文件的路径
- 一般使用第一行作为列名称,使用skip=n跳过前n行;使用comment=’#’来丢弃以#开头的行
- 参数col_names可以控制列名称
- “\n”用于添加新行
- 参数na设定使用哪些值表示缺失值
2