PyOdps小计

1、开启脚本模式

from odps import options

options.sql.settings = {"odps.sql.submit.mode" : "script"}

o.execute_sql("set odps.sql.default.file.format=aliorc;set odps.storage.force.aliorc=true;create table User_tags(*****)")

pyodps配置设置有:

from odps import options
options.sql.settings = {"odps.sql.submit.mode" : "script"} 开启脚本模式


# 设置所有输出表的生命周期(lifecycle选项)。
options.lifecycle = 30
# 使用Tunnel下载string类型时使用bytes(tunnel.string_as_binary选项)。
options.tunnel.string_as_binary = True
# 用ODPS执行PyODPS DataFrame时,可以参照下面dataframe相关配置,在sort时将limit设置为一个比较大的值。
options.df.odps.sort.limit = 100000000


通用配置
选项    说明    默认值
end_point    ODPS Endpoint。    None
default_project    默认Project。    None
log_view_host    LogView主机名。    None
log_view_hours    LogView保持时间(小时)。    24
local_timezone    使用的时区。True表示本地时间,False表示UTC,也可用pytz的时区。    None
lifecycle    所有表生命周期。    None
temp_lifecycle    临时表生命周期。    1
biz_id    用户ID。    None
verbose    是否打印日志。    False
verbose_log    日志接收器。    None
chunk_size    写入缓冲区大小。    1496
retry_times    请求重试次数。    4
pool_connections    缓存在连接池的连接数。    10
pool_maxsize    连接池最大容量。    10
connect_timeout    连接超时。    5
read_timeout    读取超时。    120
api_proxy    API代理服务器。    None
data_proxy    数据代理服务器。    None
completion_size    对象补全列举条数限制。    10
notebook_repr_widget    使用交互式图表。    True
sql.settings    ODPS SQL运行全局hints。    None
sql.use_odps2_extension    启用MaxCompute 2.0语言扩展。    False

options.sql.settings = {"odps.sql.submit.mode" : "script"} 开启脚本模式
数据上传下载配置
选项    说明    默认值
tunnel.endpoint    Tunnel的Endpoint。    None
tunnel.use_instance_tunnel    使用Instance Tunnel获取执行结果。    True
tunnel.limit_instance_tunnel    是否限制Instance Tunnel获取结果的条数。    None
tunnel.string_as_binary    在STRING类型中使用Bytes而非Unicode。    False
DataFrame配置
选项    说明    默认值
interactive    是否在交互式环境。    根据检测值。
df.analyze    是否启用非ODPS内置函数。    True
df.optimize    是否开启DataFrame全部优化。    True
df.optimizes.pp    是否开启DataFrame谓词下推优化。    True
df.optimizes.cp    是否开启DataFrame列剪裁优化。    True
df.optimizes.tunnel    是否开启DataFrame使用Tunnel优化执行。    True
df.quote    ODPS SQL后端是否用``来标记字段和表名。    True
df.libraries    DataFrame运行使用的第三方库(资源名)。    None
df.supersede_libraries    使用自行上传的Numpy替换服务中的版本。    False
df.odps.sort.limit    DataFrame有排序操作时,默认添加的Limit条数。    10000
机器学习配置
选项    说明    默认值
ml.xflow_settings    Xflow执行配置。    None
ml.xflow_project    默认Xflow工程名。    algo_public
ml.use_model_transfer    是否使用ModelTransfer获取模型 PMML。    False
ml.model_volume    在使用ModelTransfer时使用的 Volume名称。    pyodps_volume

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值