python中read table_数据导入读取read.table函数详解，如何读取不规则的数据（fill=T）...

最新推荐文章于 2023-10-30 19:34:45 发布

weixin_39549899

最新推荐文章于 2023-10-30 19:34:45 发布

阅读量3.8k

点赞数

文章标签： python中read table

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39549899/article/details/111433193

版权

本文详细介绍了Python中用于读取表格数据的read_table函数，包括处理编码问题、首行、分隔符、引用、缺损值、尾部空字段省略、字符字段中的空白以及变量类型的设定。通过设置fill=True可以处理拖尾空字段的行，strip.white=True可去除字符字段的空白。此外，文章还提到了注释、逃逸规则和效率优化策略，如设定colClasses和nrows以提高读取大文件的效率。

摘要由CSDN通过智能技术生成

函数 read.table 是读取矩形格子状数据最为便利的方式。因为实际可能遇到的情况比较多，所以预设了一些函数。这些函数调用了 read.table 但改变了它的一些默认参数。

注意，read.table 不是一种有效地读大数值矩阵的方法：见下面的 scan 函数。

一些需要考虑到问题是：

编码问题

如果文件中包含非-ASCII字符字段，要确保以正确的编码方式读取。这是在UTF-8的本地系统里面读取Latin-1文件的一个主要问题。此时，可以如下处理

read.table(file("file.dat", encoding="latin1"))

注意，这在任何可以呈现Latin-1名字的本地系统里面运行。

首行问题

我们建议你明确地设定 header 参数。按照惯例，首行只有对应列的字段而没有行标签对应的字段。因此，它会比余下的行少一个字段。(如果需要在 R 里面看到这一行，设置 header = TRUE。)如果要读取的文件里面有行标签的头字段(可能是空的)，以下面的方式读取

read.table("file.dat", header = TRUE, row.names = 1)

列名字可以通过 col.names 显式地设定；显式设定的名字会替换首行里面的列名字(如果存在的话)。

分隔符问题

通常，打开文件看一下就可以确定文件所使用的字段分隔符，但对于空白分割的文件，可以选择默认的sep = "" (它能使用任何空白符作为分隔符，比如空格，制表符，换行符)， sep = " " 或者 sep

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。