在进行特定表格的行名,列名或者指定行列的文本处理时,我们一般使用str_split函数进行操作,如对R语言的列名进行操作:
library(stringr)
#以列名为样本,以.x为分割符,取前面的部分
names(file_total) <- str_split(names(file_total),"\\.x",simplify = T)[,1]
但是如果我们以多个字符串为样本时(而非表格中的数据),再用上面相同的代码会报错,比如在提取文件的文件名过程中,我们如果使用同样的代码:
library(stringr)
#设置文件路径以及提取所有的文件路径
resultpath <- "C:/Users/12738/Desktop/fsdownload"
resultfiles <- list.files(resultpath, pattern = "*.csv$", full.names = TRUE)
#获得.c前面的字符串,basename(x),获得的是x.csv的形式
samplename <- str_split(basename(resultfiles),"\\.c")[,1]
报错:
incorrect number of dimensions ,这是因为在字符串样本处理过程中,不能自动分列导致的
于是查看说明书以后,我们使用str_split_fixed 函数,代码如下:
library(stringr)
resultpath <- "C:/Users/12738/Desktop/fsdownload"
resultfiles <- list.files(resultpath, pattern = "*.csv$", full.names = TRUE)
#n = 2 是分成两列
samplename <- str_split_fixed(basename(resultfiles),"\\.c",n = 2)[,1]
samplename 获得的就是所有csv文件的基础名