今天在处理下机的数据时候,遇到这个问题:
log2和normalized count数据在一个sheet中。虽然可以手动分开再处理,但是次次这么做工作量非常大。
最后使用dplyr 包内的row_number() 函数成功解决。
对 row_number() 这个函数还是很难理解
对于分割来说,一定要找到一定的分割条件,再通过这些条件去想办法分割。在这个例子中,我们发现标题可以用来分割,只要已第12行的标题分上下就好了。
log2_norm_df <- norm_df %>% filter(row_number() < which(V1=="mRNA - normalized linear count data"))
linear_norm_df <- norm_df %>% filter(row_number() > which(V1=="mRNA - normalized linear count data"))
> log2_norm_df <- norm_df %>% filter(row_number() <which(V1=="mRNA - normalized linear count data"))
成功分开