maxcomputer pyodps数据基本操作

1.阿里maxcomputer中的datawork支持python代码调用,运行;新建PyODPS 节点,将会包含一个全局的变量 odps 或者 o ,即 ODPS 入口,用户调用datawork中的表数据。

2.pyodps中创建表,但不建议这样操作,建议更直接的sql节点建表https://help.aliyun.com/document_detail/90412.html?spm=a2c4g.11186623.2.8.12d744cfBBmd6V#concept-lhx-tmf-cfb

3.pyodps执行sql语句,入口对象的execute_sql()run_sql()方法可以执行SQL语句,其返回值是任务实例。

o.execute_sql('select * from dual')  #同步的方式执行,会阻塞直到SQL语句执行完成。
instance = o.run_sql('select * from dual')  #异步的方式执行。

4.运行SQL的Instance能够直接执行open_reader操作读取SQL执行结果。

with o.execute_sql('select * from dual').open_reader() as reader:
    for record in reader:
    # 处理每一个record。

5.获取表数据 

  • 使用对象入口的read_table()方法,举例如下。
    for record in o.read_table('test_table', partition='pt=test'):
    # 处理一条记录。
  • 如果您仅需要查看每个表的最开始的小于1万条数据,可以对表对象调用head()方法。
    t = o.get_table('dual')
    # 处理每个Record对象。
    for record in t.head(3):
  • 在表上执行open_reader()操作来读取数据。如下:
    • 使用with表达式的写法如下所示。
      with t.open_reader(partition='pt=test') as reader:
      count = reader.count
      for record in reader[5:10]  # 可以执行多次,直到将count数量的record读完,此处可以改造成并行操作。
      # 处理一条记录。
    • 不使用with表达式的写法如下所示。
      reader = t.open_reader(partition='pt=test')
      count = reader.count
      for record in reader[5:10]  # 可以执行多次,直到将count数量的record读完,这里可以改造成并行操作。
      # 处理一条记录。
  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在MaxCompute的PyODPS中,可以使用第三方库.tar.gz文件的方法如下: 1. 首先,确保已经在本地安装了所需的第三方库。 2. 创建一个新的PyODPS项目(project)或者打开一个已有的项目。 3. 进入PyODPS的开发环境,可以使用Jupyter Notebook、PyCharm或者其他支持PyODPS的IDE。 4. 将第三方库.tar.gz文件上传到MaxCompute的资源(resource)中。可以使用以下代码实现: ```python from odps import ODPS # 创建ODPS连接 odps = ODPS(access_id='<your-access-id>', secret_access_key='<your-secret-access-key>', project='<your-project-name>', endpoint='<your-endpoint>') # 上传资源文件 odps.resources.create(name='third-party-library', fileobj='<path-to-tar.gz-file>') ``` 注意替换`<your-access-id>`, `<your-secret-access-key>`, `<your-project-name>`, `<your-endpoint>`和`<path-to-tar.gz-file>`为你自己的信息和文件路径。 5. 使用第三方库。在PyODPS中使用第三方库的方法与在本地Python环境中使用相同,只需要导入这个库即可。以下是一个示例: ```python from odps import ODPS import your_lib # 创建ODPS连接 odps = ODPS(access_id='<your-access-id>', secret_access_key='<your-secret-access-key>', project='<your-project-name>', endpoint='<your-endpoint>') # 使用第三方库 your_lib.do_something() ``` 注意替换`<your-access-id>`, `<your-secret-access-key>`, `<your-project-name>`和`<your-endpoint>`为你自己的信息。 这样,就可以在MaxCompute的PyODPS中使用第三方库.tar.gz文件了。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值