python代码提交到spark集群并设定定时任务

本文档介绍了如何将Python代码提交到Spark集群,包括启动Thrift服务,通过Linux安装Python库,特别是处理权限问题,以及如何在集群中复制和共享库。此外,还详细说明了如何设置定时任务来执行Python作业。
摘要由CSDN通过智能技术生成

一、启动thrift

因为用到了happybase,需要先在服务器上上启动thrift服务,
关闭终端thrift继续运行命令如下:

nohup hbase thrift -p 9090 start

二、linux从本地安装python库

以thriftpy为例

解压 tar zxvf thriftpy-0.3.9.tar.gz

回到当前目录 cd thriftpy-0.3.9

编译 python setup.py build

安装 python setup.py install

然而报错表示权限不够,切换到root账户命名为sudo su
重新执行上述操作。

对于集群上其他机器

在一台机器上将所有需要用到的库都装好后,这里默认安装在/usr/local/lib/python2.7/dist-packages文件夹里,其他机器可以直接将dist-packages文件夹复制到相应位置,即可直接import装好的python库

下面代码实现将10.1.140.11:/usr/local/lib/python2.7/dist-packages 目录或文件 复制到本地(目前操作的节点机器上)/home/hadoop/AA-packages,并将原dist-packages重新命名为AA-packages

scp -r hadoop@10.1.140.11:/usr/local/lib/python2.7/dist-packages
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值