背景:
txt数据文件(146行,25084列) 转换为 xlsx文件(最大1048576行,最大16384列),其中txt中的数据是以空格分隔;
但txt数据文件的列数(25084)超过xlsx文件的最大列(16384)。
考虑把数据拆分成两部分,放到两个sheet页里面。
思路:
- 按空格分割,读取txt数据(146行,25084列)
- 转置数据(25084行,146列)
- 写入xlsx文件的sheet1
- 在xlsx文件中,手动复制前15000行数据,进行选择性粘贴(勾选“转置”)到sheet2;同理,手动复制15000行之后的数据,进行选择性粘贴(勾选“转置”)到sheet3;【这里是把一行数据,放到两个sheet页里了,】
转置数据 (python代码)
import pandas as pd
# 读取TXT文件
df = pd.read_csv('data.txt', delimiter='\t')
# 将读取的数据行列转置
df2 = pd.DataFrame(df.values.T, index=df.columns, columns=df.index)
# 将数据保存为Excel文件
df2.to_excel('data.xlsx', index=False)