R语言中 read.table 和 read.delim 之间的区别

原创于 2025-07-29 13:27:49 发布 · 636 阅读

CC 4.0 BY-SA版权

文章标签：

9 篇文章

订阅专栏

在 R 语言中，read.table 和 read.delim 都是用于读取文本文件（如 CSV、TSV 等）的函数，主要区别在于它们的默认参数设置，这导致它们在处理不同类型的文件时表现不同。以下是详细对比：

read.table: 通用函数，用于读取以列形式组织的文本文件，允许用户自定义分隔符、是否包含标题行等参数。
read.delim: read.table 的一个特定变体，专门为**制表符分隔（tab-delimited）**的文件（如 .tsv）优化，默认参数针对这种格式进行了预配置。

假设有一个文件 data.txt，内容如下：

name    age    score
Alice   25     90
Bob     30     85

data <- read.table("data.txt", sep = "\t", header = TRUE)

data <- read.delim("data.txt")

两者结果相同，因为 read.delim 的默认设置已经匹配了制表符分隔和包含标题行的文件。

如果文件使用其他分隔符（如逗号 ,），read.table 更灵活，可以通过设置 sep 参数适应（如 sep = "," 用于 CSV 文件）。
read.delim 更适合快速读取标准制表符分隔文件，减少手动设置参数的工作。
如果文件格式复杂（例如包含特殊字符、缺失值等），可能需要进一步调整其他参数（如 na.strings、quote 等），两者都支持这些高级选项。