R语言：数据输入

FutureMasters

已于 2023-01-05 12:22:51 修改

阅读量1k

点赞数

文章标签： r语言数据分析

于 2023-01-05 12:13:05 首次发布

本文链接：https://blog.csdn.net/qq_36078275/article/details/128561043

版权

数据输入

描述

读取表格格式的文件并从中创建数据框，使用对应于文件中字段的行和变量的大小例。

用法

read.table(file, header = FALSE, sep = "", quote = "\"'",

dec = ".", row.names, col.names,

as.is = !stringsAsFactors,

na.strings = "NA", colClasses = NA, nrows = -1,

skip = 0, check.names = TRUE, fill = !blank.lines.skip,

strip.white = FALSE, blank.lines.skip = TRUE,

comment.char = "#", allowEscapes = FALSE, flush = FALSE,

stringsAsFactors = default.stringsAsFactors(),

encoding = "unknown")

read.csv(file, header = TRUE, sep = ",", quote="\"", dec=".",

fill = TRUE, comment.char="", ...)

read.csv2(file, header = TRUE, sep = ";", quote="\"", dec=",",

fill = TRUE, comment.char="", ...)

read.delim(file, header = TRUE, sep = "\t", quote="\"", dec=".",

fill = TRUE, comment.char="", ...)

read.delim2(file, header = TRUE, sep = "\t", quote="\"", dec=",",

fill = TRUE, comment.char="", ...)

参数

file	要从中读取数据的文件的名称。表的每一行显示为文件的一行。如果是这样不包含绝对路径，文件名相对于当前工作目录 .波浪号扩展在支持的地方执行。或者，可以是可读的（如果必要，如果是这样，则在函数调用结束时关闭）。（如果使用，则提示行可能会有些混乱。在Unix和Windows上用空行或EOF信号终止输入。任何推回都将在返回前清除。也可以是完整的网址。读取不是当前编码的数据文件（例如 UTF-8 语言环境中的拉丁语 1 文件或相反）使用连接设置参数。
header	一个逻辑值，指示文件是否包含变量的名称作为其第一行。如果缺少，则值为根据文件格式确定：设置为当且仅当第一行包含的字段比列数。headerTRUE
sep	字段分隔符。每行上的值文件由此字符分隔。如果（默认值为）分隔符为“空格”，即一个或多个空格、制表符、换行符或回车符。sep = ""read.table
quote	引用字符集。禁用引用总共，使用 .请参阅有关引号中嵌入的引号的行为。quote = ""
dec	文件中用于小数点的字符。
row.names	行名的向量。这可以是一个矢量给出实际的行名，或给出列的单个数字包含行名或字符串的表，提供包含行名的表列的名称。如果存在标题，并且第一行包含的字段少于列数，输入中的第一列用于行名。否则，如果缺少，则行为编号。使用强制行编号。缺少或生成被视为的行名是“自动的”（并且不由保留）。row.namesrow.names = NULLNULLrow.namesas.matrix
col.names	变量的可选名称向量。默认值是使用后跟列号。"V"
as.is	的默认行为是转换字符变量（未转换为逻辑、数字或复杂）的因素。该变量控制转换未由另行指定的列。它的值要么是逻辑向量（如果必要），或数字或字符索引的向量指定不应将哪些列转换为因子。注意：禁止所有转换，包括数字转换列，设置。请注意，这是按列指定的（而不是按变量），因此包括行名列（如果有）和任何要跳过的列。read.tableas.iscolClassescolClasses = "character"as.is
na.strings	字符串的字符向量，其为解释为值。空白字段也是被认为是逻辑、整数、数字和复杂字段。
colClasses	字符。要假定的类向量列。根据需要回收，或者如果字符矢量命名的、未指定的值被视为。可能的值为（当使用），（跳过列时），原子之一向量类（逻辑、整数、数字、复数、字符、原始），或、或。否则需要有一个方法（从包方法）用于从转换为指定的正式形式类。请注意，它是按列指定的（而不是按列指定的变量），因此包括行名列（如果有）。
nrows	整数：要读入的最大行数。阴性和其他无效值将被忽略。
skip	整数：之前要跳过的数据文件的行数开始读取数据。
check.names	逻辑。如果然后的名称检查数据框中的变量以确保它们语法上有效的变量名。如有必要，可以对其进行调整（通过）以便它们是，并且还确保没有重复项。
fill	逻辑。如果万一行不相等长度，空白字段是隐式添加的。查看详细信息。TRUE
strip.white	逻辑。仅在具有以下情况时使用已指定，并允许剥离前导和尾随字段中的空格（字段总是被剥离）。有关更多详细信息，请参阅，请记住，列可能包含行名。
blank.lines.skip	逻辑：如果空行中的输入将被忽略。TRUE
comment.char	字符：长度为 1 的字符向量包含单个字符或空字符串。用于完全关闭对评论的解释。"狗"
allowEscapes	逻辑。是否应该处理 C 样式转义，例如逐字读取（默认值）？请注意，如果不在引号内，这些可以解释为分隔符（但不是作为注释字符）。有关详细信息，请参见。
flush	逻辑：如果，将刷新到读取请求的最后一个字段后结束行。这允许在最后一个字段之后放置注释。
stringsAsFactors	逻辑：是否应转换字符向量因素
encoding	输入字符串假定的编码。是的用于将字符串标记为已知拉丁语-1 或 UTF-8：它不用于重新编码输入。
...	要传递给的更多参数。read.table

详

此函数是将表格数据读入 R 的主要方法。

如果字段或行不包含任何内容，则该字段或行为“空白”（除了空格（如果未指定分隔符）在注释字符之前或字段或行的末尾。

如果未指定，并且标题行少一个条目比列数，第一列取行名。这允许从它们被打印出来。如果指定并执行不引用第一列，该列将从此类文件中丢弃。row.namesrow.names

数据列的数量是通过查看前五行来确定的输入（或整个文件，如果少于五行），或来自的长度（如果已指定）和更长。如果或为真，这可能是错误的，因此请在必要时指定。col.namesfillblank.lines.skipcol.names

read.csv并且与默认值相同。它们适用于读取“逗号分隔值”文件（'.csv'）或（）变体用于使用逗号作为小数点和分号的国家/地区作为字段分隔符。同样，并且用于读取分隔文件，默认为分隔符的 TAB 字符。请注意，在这些变体中，注释字符已禁用。read.csv2read.tableread.csv2read.delimread.delim2header = TRUEfill = TRUE

跳过注释字符后的其余行;引号不会在注释中处理。允许完整的注释行提供;但是，前面的注释行到标题中必须在第一个非空白处包含注释字符列。blank.lines.skip = TRUE

支持带有嵌入换行符的带引号的字段，除非在注释字符。

价值

包含文件中的数据。
空输入是一个错误，除非指定，当返回 0 行数据框：同样，如果结果为 0 行数据框，则只给出一个标题行。请注意，在任何一种情况下，列都是逻辑的，除非是提供。
结果中的字符串（包括因子水平）将具有声明的编码，如果为 IS 或 data.frame col.namesheader = TRUEcolClassesencoding"latin1""UTF-8"

注意

中引用的列包括行名列（如果有）。as.iscolClasses

如果指定为六个原子向量类。colClasses

使用，即使是轻微的高估，也将有助于记忆用法。nrows

使用速度会明显更快。comment.char = ""

read.table不是读取大矩阵的正确工具，特别是那些具有许多列的数据框：它旨在读取可能具有非常不同类别的列的数据框。请改用。scan

引用

钱伯斯，J.M.（1992）模型数据。S eds J. M. Chambers 和 T. J. Hastie、Wadsworth & Brooks/Cole 中的统计模型第 3 章。

参见

R 数据导入/导出手册。

FutureMasters

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
R语言：数据输入

请注意，这是按列指定的（而不是按变量），因此包括行名列（如果有）和任何要跳过的列。或者，可以是可读的（如果必要，如果是这样，则在函数调用结束时关闭）。数据列的数量是通过查看前五行来确定的输入（或整个文件，如果少于五行），或来自的长度（如果已指定）和更长。可能的值为（当使用），（跳过列时），原子之一向量类（逻辑、整数、数字、复数、字符、原始），或、或。这可以是一个矢量给出实际的行名，或给出列的单个数字包含行名或字符串的表，提供包含行名的表列的名称。否则，如果缺少，则行为编号。
复制链接

扫一扫