征得张敬信老师同意,本号将转载张老师关于R语言tidyverse包一系列文章,为大家进行医学研究提供助力。
来源:R&Python数据科学 知乎专栏
作者简介:张敬信,高校数学教师,研究兴趣:数学,数学建模,数据挖掘,机器学习,Matlab, R语言,Python,Mathematica,Latex
链接:https://www.zhihu.com/people/huc_zhangjingxin
一. 相关包简介
(1) tibble包
R 数据框的更先进的替代,不将字符串转化为因子型,不重命名列,输出内容更智能,选择 tibble 子集仍是 tibble(Base R 中,1列返回向量)
查看数据框:glimpse()
创建数据框:tibble()和 tribble() (智能行tibble)
强制转化为数据框:as_tibble()和enframe()
操作行名:rownames_to_column()和column_to_rownames()
(2) readr包
读写纯文本文件,包括带分隔符的文本文件,如 csv和 tsv. 也能读写序列化的 R 对象 rds,若想保存数据集后续再加载回来,rds将保存元数据和该对象的状态,如分组和