分隔符的使用



一、制表符 ‘\t’:通常用于TSV(制表符分隔值)文件

pd.read_csv('data.tsv', sep = '\t')

什么是TSV文件?
制表符分隔值 (TSV) 文件格式表示用纯文本格式的制表符分隔的数据。该文件格式类似于 CSV,用于以结构化方式组织数据,以便在不同应用程序之间导入和导出。该格式主要用于电子表格应用程序和数据库中的数据导入/导出和交换。 TSV 文件中的每条记录都包含在单行文本文件中,其中每个字段值由制表符分隔。 TSV 文件格式的媒体类型是文本/制表符分隔值。
在这里插入图片描述

二、空格 (’ '):有时数据列之间仅用单个空格分隔。

pd.read_csv('data.txt', sep = ' ')

三、逗号 (,):这是 CSV 文件中最常见的分隔符。

pd.read_csv('data.csv', sep = ',')

四、正则表达式:如果数据文件中使用了不规则的空白(如多个空格或组合空格和制表符),可以使用正则表达式来指定 sep。

pd.read_csv('data.txt', sep = '\s+')

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值