![](https://img-blog.csdnimg.cn/6a0ab19c949d48d9b0cb7e94de125ee3.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
R语言-数据预处理
由于各应用系统的数据缺乏统一的标准和定义,数据结构有较大的差异,通常情况下我们是无法处理由不同收集技术和来源记录的原始数据。所以需要进行数据预处理,将原始数据转换为正确格式,为更准确的下游流程做好准备。本专栏记录了本人在使用R语言处理生物学数据时遇到的问题和解决方案。
倪桦
中国科学院大学硕士在读学生
展开
-
R语言-data.table包用来加速大型数据集的加载和运算
R语言data.table包是自带包data.frame的升级版,用于数据框格式数据的处理,最大的特点是快。它内部处理的步骤进行了程序上的优化,使用多线程,还有很多C编写的函数,大大加快数据运行速度。尤其当对一两百万甚至更大数据集进行修改或运算时,由于data.table直接对数据本身做运算,不创建副本,因此相较于基本的data.frame格式,data.table在面对大型数据集时,进行聚合排序以及分组运算的性能非常高 !............原创 2022-07-07 00:48:49 · 1486 阅读 · 0 评论 -
R语言apply()族函数概要,用来替代经典循环结构提高遍历效率
R语言apply()族函数概要,用来替代经典循环结构提高遍历效率原创 2022-07-01 22:14:37 · 690 阅读 · 0 评论 -
R语言-超大型数据框与稀疏矩阵的切片-处理as.matrix方法的“problem too large”异常
R语言-超大型数据框与稀疏矩阵的切片-处理as.matrix方法的“problem too large”异常原创 2022-06-27 18:41:17 · 742 阅读 · 0 评论 -
R语言组合多个向量Vector为数据框
R语言组合多个向量Vector为数据框原创 2022-06-26 13:15:39 · 1811 阅读 · 0 评论 -
R语言创建空数据框(Empty Data Frame )用于追加数据
R语言创建空数据框(Empty Data Frame )用于追加数据原创 2022-06-26 13:14:57 · 9427 阅读 · 0 评论 -
dplyr-as.numeric保留行名转换数据框(矩阵)的所有字符型列向量为数值型
dplyr-as.numeric保留行名转换数据框(矩阵)的所有字符型列向量为数值型原创 2022-06-26 13:14:06 · 3913 阅读 · 1 评论 -
dplyr-distinct 行记录去重细节处理
dplyr-distinct 行记录去重细节处理原创 2022-06-26 13:13:22 · 996 阅读 · 0 评论 -
dplyr-select 根据条件选择列向量
dplyr-mutate-across 选择多列应用函数示例原创 2022-06-26 13:12:25 · 421 阅读 · 0 评论 -
dplyr-summarise 数据分组进行统计描述
dplyr-summarise 数据分组进行统计描述原创 2022-06-25 15:30:43 · 661 阅读 · 0 评论 -
plyr::ldply-列表[list]转换数据框[data.frame]
plyr::ldply-列表[list]转换数据框[data.frame]原创 2022-06-25 15:29:54 · 408 阅读 · 0 评论 -
按小数点(英文句号)“.“(dot)分割字符串
R语言字符分割-按小数点(英文句号)"."(dot)分割字符串的转义处理原创 2022-06-25 15:29:01 · 563 阅读 · 0 评论 -
dplyr-aggregate数据框聚合
dplyr-aggregate对数据框进行行或列的简单聚合处理原创 2022-06-25 15:27:39 · 99 阅读 · 0 评论 -
R语言字符串字符的大小写转换
R语言字符串大小写转换原创 2022-06-25 15:25:47 · 1778 阅读 · 0 评论 -
R语言数据表三元组(长数据)格式与宽数据格式转换
R语言数据表三元组(长数据)格式与宽数据格式转换原创 2022-06-25 15:22:05 · 806 阅读 · 0 评论 -
dplyr-grep对数据框进行全局行过滤
dplyr-grep对数据框进行全局行过滤原创 2022-06-25 15:20:56 · 167 阅读 · 0 评论 -
dplyr-gsub配合使用替换全数据框的值
dplyr-gsub配合使用替换全数据框的值原创 2022-06-25 15:20:02 · 263 阅读 · 0 评论 -
dplyr-tibble转换数据框的行名与列向量
dplyr-tibble转换数据框的行名与列向量原创 2022-06-25 15:18:26 · 853 阅读 · 0 评论 -
dplyr-tidyr-drop_na去除包含空值的行
dplyr-tidyr-drop_na方法去除数据框中包含空值的行原创 2022-06-25 15:16:54 · 940 阅读 · 0 评论