Python SDK介绍
安装
快速安装
$ sudo pip install pydatahub
源码安装
$ git clone https://github.com/aliyun/aliyun-datahub-sdk-python.git
$ cd aliyun-datahub-sdk-python
$ sudo python setup.py install
常见问题
1.如果安装过程中出现错误信息’Python.h: No such file or directory’,常用的操作系统安装方式如下:
$ sudo apt-getinstall python-dev# for python2.x installs
$ sudo apt-getinstall python3-dev# for python3.x installs
$ sudo yum install python-devel# for python2.x installs
$ sudo yum install python34-devel# for python3.4 installs
2.如果使用windows操作系统,根据提示信息可到 此处 下载安装对应版本的 Visual C++ SDK。
Windows 10 安装cprotobuf依赖时如果报类似如下错误,也表示需要安装Visual C++ 生成工具:
bulding'cprotobuf.internal'extention
error:[WinError2]Thesystem cannot find the file specified
推荐使用python3.6或以上,会明确提示所需版本及链接信息。
3.Windows 下如果安装依赖时报类似如下错误,是环境问题所致,请搜索相关错误,根据具体情况,拷贝所需文件,或是直接使用 developer command prompt 工具进行安装:
LINK:fatal error LNK1158:cannot run'rc.exe'
4.网络环境受限无法自动使用pip安装依赖时,可以从github中下载相关依赖,并按照readme进行安装。
安装验证
$ python-c"from datahub import DataHub"
如果上述命令执行成功,恭喜你安装Datahub Python版本SDK成功!
基本概念
准备工作
访问DataHub服务需要使用阿里云认证账号,需要提供阿里云accessId及accessKey。 同时需要提供访问的服务地址。
创建Project或使用SDK接口进行创建
初始化Datahub
importsys
importtraceback
fromdatahubimportDataHub
fromdatahub.exceptionsimportResourceExistException
fromdatahub.modelsimportFieldType,RecordSchema,TupleRecord,BlobRecord,CursorType,RecordType
access_id=***your access id***
access_key=***your access key***
endpoint=***your datahub server endpoint***
dh=DataHub(access_id,access_key,endpoint)
Project操作
创建示例
project_name='project'
comment='comment'
try:
dh.create_project(project_name,comment)
print("create project success!")
print("=====================================