DataStage 使用心得

DataStage 使用心得
最近一个月开始使用datastage,遇到很多问题,在这里和大家分享一下。
一.    datastage支持很多数据库的直接抽取,也可以对普通文本文件,XML文件进行抽取和转换。
实际使用中发现用的多是文本文件,并不推荐直接重数据库读取数据进行抽取和转换。个人感觉如果直接从数据库抽取和转换数据
会影响datastage的执行速度。如果使用文本文件,可以减轻数据库服务器的压力,直接使用datastage server和datastage client
的资源,因为一个datastage server可以扩充多个datastage client,datastage server根据每个client的运行情况调度作业运行,
相对于以前把数据的抽取转换放在数据库服务器上速度要会,特别是在数据量很大的时候。
二.datastage实现了数据抽取和转换的可视化,简单的说就是傻瓜式的使用数据库。但是datastage只能实现数据的轻度整合,很难
实现复杂的数据抽取和转换。比如在用Aggregation stage时我即计算和又要计算条数,在Aggregation stage里要么算和,要么计算
条数,不能同时计算。解决方法是在聚合前多加一个字段cont_sign,默认值1,在算条数时sum该字段即可。
三.数据抽取完成后不能增量装入数据库。datastage对装入有索引的表的策略是先删除表的索引,装入数据重建索引。当增量装入数据
时无法成功重建唯一索引。
四.在datastage中好像不支持存储过程和函数,要用shell封装后调度执行。
五.我个人觉得datastage调试很麻烦,报错信息不清楚,特别是在stage较多的时候。非常浪费时间。
以上是我在使用datastage时遇到的问题,如有问题感谢大家指正。
关于datastage在调试时的报错信息不知各位网友是否有相关资料可以提供?
还有如何在datastage中使用存储过程和函数,除了用shell封装以外,还有什么好方法吗?怎么实现?
datagestage有个API接口的文档在那里可以找到??
  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值