parquet存储linux文件,使用AWS Lambda读取存储在S3中的Parquet文件(Python 3)

我能够使用fastparquet将镶木地板文件写入S3 . 这有点棘手,但是当我意识到将所有依赖项组合在一起时,我必须使用与Lambda正在使用的完全相同的Linux .

我是这样做的:

1.使用与Lambda一起使用的Amazon Linux映像启动EC2实例

注意:您可能需要安装许多软件包并将python版本更改为3.6,因为此Linux不适用于开发 . 这是我寻找包的方式:

sudo yum list | grep python3

我安装了:

python36.x86_64

python36-devel.x86_64

python36-libs.x86_64

python36-pip.noarch

python36-setuptools.noarch

python36-tools.x86_64

2.使用此处的说明构建一个zip文件,其中包含我的脚本将使用的所有依赖项,并将它们全部转储到一个文件夹中,并使用以下命令压缩它们:

mkdir parquet

cd parquet

pip install -t . fastparquet

pip install -t . (any other dependencies)

copy my python file in this folder

zip and upload into Lambda

注意:我必须解决一些限制:Lambda不允许您上传更大的50M拉链并解压缩> 260M . 如果有人知道更好的方法来获取Lambda的依赖,请分享 .

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值