php 读csv跳过标题,关于r：read.csv，标题位于第一行，跳过第二行

零太医

于 2021-03-21 11:32:46 发布

阅读量562

点赞数

文章标签： php 读csv跳过标题

该问题讨论了如何在R中读取CSV文件时跳过第二行并使用第一行作为数据框的标题。用户遇到了在使用read.csv时第二行变成了列名的问题。解决方案包括使用readLines读取文件，然后去掉第二行后再用read.csv，或者直接使用data.table的fread函数结合Linux命令来跳过指定行。

摘要由CSDN通过智能技术生成

本问题已经有最佳答案，请猛点这里访问。

我有一个包含两个标题行的CSV文件，第一行我想成为标题，但第二行我想放弃。如果我执行以下命令：

data

第一行成为标题，文件的第二行成为数据框的第一行：

Xaaaaaaaaa X X.1 Xbbbbbbbbbb X.2 X.3

1 Date PX_LAST NA Date PX_LAST NA

2 31/12/2002 38.855 NA 31/12/2002 19.547 NA

3 02/01/2003 38.664 NA 02/01/2003 19.547 NA

4 03/01/2003 40.386 NA 03/01/2003 19.547 NA

5 06/01/2003 40.386 NA 06/01/2003 19.609 NA

6 07/01/2003 40.195 NA 07/01/2003 19.609 NA

我想跳过CSV文件的第二行，只是得到

X1.HK.Equity X X.1 X2.HK.Equity X.2 X.3

2 31/12/2002 38.855 NA 31/12/2002 19.547 NA

3 02/01/2003 38.664 NA 02/01/2003 19.547 NA

4 03/01/2003 40.386 NA 03/01/2003 19.547 NA

5 06/01/2003 40.386 NA 06/01/2003 19.609 NA

6 07/01/2003 40.195 NA 07/01/2003 19.609 NA

我尝试了data ，但是返回：

Date PX_LAST X Date.1 PX_LAST.1 X.1

1 31/12/2002 38.855 NA 31/12/2002 19.547 NA

2 02/01/2003 38.664 NA 02/01/2003 19.547 NA

3 03/01/2003 40.386 NA 03/01/2003 19.547 NA

4 06/01/2003 40.386 NA 06/01/2003 19.609 NA

5 07/01/2003 40.195 NA 07/01/2003 19.609 NA

6 08/01/2003 40.386 NA 08/01/2003 19.547 NA

标题行来自我的CSV文件的第二行，而不是第一行。

谢谢。

您可以尝试两步法。第一步，从没有标题的第三行开始读取数据。仅将第一行作为字符向量读取，然后将字符向量添加为数据名称。

我检查了您的代码，这一行对我有用：df

这应该可以解决问题：

all_content = readLines("file.csv")

skip_second = all_content[-2]

dat = read.csv(textConnection(skip_second), header = TRUE, stringsAsFactors = FALSE)

使用readLines的第一步将整个文件读入一个列表，其中列表中的每个项目都代表文件中的一行。接下来，使用R中的负索引表示select all but this index的事实来舍弃第二行。最后，我们将此数据输入到read.csv以将其处理为data.frame。

感谢您的回复。最后一行dat = read.csv(skip_second, header = TRUE, stringsAsFactors = FALSE)给我一个错误Error in file(file,"rt") : invalid description argument。如何获取read.csv接受变量而不是文件路径？

另外使用textConnection。

作为Paul的负责人，这种方法可以很好地处理较小的文件(小于5MB)，但是对于较大的文件却有麻烦。我问了一个问题，并在下面的较大文件上正常工作后提供了答案：stackoverflow.com/questions/24921387/

您可以直接从数据帧中删除标头后的第一行，以允许您在一行中执行以下操作：

df

如果我的数据文件" test.txt"如下：

var1, var2

units1, units2

2.3,6.8

4.5,6.7

这给了我

> read.csv("test.txt",header=T)[-1,]

var1 var2

2 2.3 6.8

3 4.5 6.7

这可以准确地回答您的问题，但是为了概括答案，您还可以通过以下方式跳过第N行到第M行：

df

其中N和M当然是整数。

注意：此方法会将所有列转换为因数。

str(read.csv("test.csv", header = TRUE)[-1,])

# 'data.frame': 2 obs. of 2 variables:

# $ var1: Factor w/ 3 levels"2.3","4.5","units1": 1 2

# $ var2: Factor w/ 3 levels" units2","6.7",..: 3 2

在Linux(或Mac)上，您可以利用能够在data.table::fread中使用linux命令的优势，因此

data.table::fread("sed -e '2d' myfile.txt", data.table = F)

将跳过第二行。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。