文章目录
一、制表符 ‘\t’:通常用于TSV(制表符分隔值)文件
pd.read_csv('data.tsv', sep = '\t')
什么是TSV文件?
制表符分隔值 (TSV) 文件格式表示用纯文本格式的制表符分隔的数据。该文件格式类似于 CSV,用于以结构化方式组织数据,以便在不同应用程序之间导入和导出。该格式主要用于电子表格应用程序和数据库中的数据导入/导出和交换。 TSV 文件中的每条记录都包含在单行文本文件中,其中每个字段值由制表符分隔。 TSV 文件格式的媒体类型是文本/制表符分隔值。
二、空格 (’ '):有时数据列之间仅用单个空格分隔。
pd.read_csv('data.txt', sep = ' ')
三、逗号 (,):这是 CSV 文件中最常见的分隔符。
pd.read_csv('data.csv', sep = ',')
四、正则表达式:如果数据文件中使用了不规则的空白(如多个空格或组合空格和制表符),可以使用正则表达式来指定 sep。
pd.read_csv('data.txt', sep = '\s+')