Windows系统查看parquet文件

博客讲述了在项目中遇到的数据迁移问题,即当源数据库表结构修改后未及时通知,导致S3到Redshift的数据导入失败。为解决此问题,作者介绍了如何下载Python编译器,安装parquet-tools库,并通过命令行工具检查parquet文件的表结构,以确保与源数据库同步。
摘要由CSDN通过智能技术生成

一、背景

最近项目上数据导入redshift是从s3,并且s3上文件格式为parquet。经常会出现的问题是,源数据库对表结构进行了修改之后又未及时告知我们,导致s3->redshift报错,故可能有需求下载文件看一下parquet文件来确认表结构(源数据库不允许直连),很是无语

二、操作

1、下载python3编译器

2、安装parquet-tools 库

pip install parquet-tools

3、打开命令行终端,输入命令

parquet-tools show [parquet文件绝对路径]

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

某可儿同学的博客

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值