1.安装库
1.1 pyarrow #为了读取文件
1.2 pandas #将文件转为pandas格式
1.3 openpyxl #为了存入excel格式
pip install pyarrow
pip install pandas
pip install openpyxl
安装截图如下,因为之前已经安装过pandas库,这里仅显示其余两个库的安装
2. 代码
import pyarrow.parquet as pq
import pandas as pd
parquet_file = pq.ParquetFile("C:/Users/admin/Desktop/wiki/test-00000-of-00001-7231805191546d57.parquet")
data = parquet_file.read().to_pandas()
data = data[:50]
df=pd.DataFrame(data)
excel_path="C:/Users/admin/Desktop/data.xlsx"
df.to_excel(excel_path,index=False)
print(f'数据已保存到 {excel_path}')