R语言导入txt文本报错：more columns than column names（列的数目比列的名字要多）问题解决

最新推荐文章于 2024-06-12 13:51:19 发布

devoen

最新推荐文章于 2024-06-12 13:51:19 发布

阅读量1.1w

点赞数 6

分类专栏： R 文章标签： r语言

本文链接：https://blog.csdn.net/devoen/article/details/115478422

版权

R 专栏收录该内容

1 篇文章

订阅专栏

本文介绍了在R语言中遇到的txt文件读取错误'morecolumnsthancolumnnames'，通过发现编码问题并设置fileEncoding为'utf-8'成功解决。重点在于识别和处理编码问题对数据导入的影响。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

R语言导入txt文本报错：more columns than column names（列的数目比列的名字要多）问题解决

mergedata <- do.call("rbind",
                     lapply(dir,
                            function(x){ data = read.table(x,sep = "|",
                                                            colClasses="character",                                                             
                                                             header = T)
                            
                                   data$项目 <- unlist(strsplit(x,'/'))[length(unlist(strsplit(x,'/')))]
                                    return(data)}
))

今天在用R批量导入TXT文件进行合并时（代码如上），报错：

Error in read.table(x, sep = "|", colClasses = "character", header = T) : 
  more columns than column names

在查看了帮助后，将各个参数逐一试了一下，将默认参数全部反选了一遍：

read.table(file, header = FALSE, sep = "", quote = "\"'",
           dec = ".", numerals = c("allow.loss", "warn.loss", "no.loss"),
           row.names, col.names, as.is = !stringsAsFactors,
           na.strings = "NA", colClasses = NA, nrows = -1,
           skip = 0, check.names = TRUE, fill = !blank.lines.skip,
           strip.white = FALSE, blank.lines.skip = TRUE,
           comment.char = "#",
           allowEscapes = FALSE, flush = FALSE,
           stringsAsFactors = default.stringsAsFactors(),
           fileEncoding = "", encoding = "unknown", text, skipNul = FALSE)

最终在修改到fileEncoding = ""时突然想到会不会是编码问题，尝试令fileEncoding = "utf-8"，竟然成功读取了！！！

修改后代码如下：

mergedata <- do.call("rbind",
                     lapply(dir,
                            function(x){ data = read.table(x,sep = "|",
                                                             colClasses="character",
                                                             fileEncoding = "utf-8",
                                                             header = T)
                            
                                   data$项目 <- unlist(strsplit(x,'/'))[length(unlist(strsplit(x,'/')))]
                                    return(data)}
))