informatica简易教程

一、环境配置
1.informatica的元数据(账号、密码…)信息保存在Oracle上面
2.Linux下在infa/bin里有informatica的启动脚本startup_infa.sh
3.修改windows主机的hosts,地址C:\Windows\System32\drivers\etc
添加192.168.68.128  infa到文件中,infa就是到时候连接配置的域名,而192.168.68.128就是informatica服务器主机的ip地址。
4.配置连接

*Gateway Host就是我们刚才修改那个C:\Windows\System32\drivers\etc里面的域名
*Gateway port必须为6001
*Domain Name可以随便取
二、模块

Informatica总的来说由4大模块组成:
Repository Manager--资料库,Designer--设计器,Workflow Manager--物理设计,Workflow Monitor--监控;
1.Repository Manager--资料库

可以管理文件夹,导入导出工作流极相关文件。
2.Designer--设计器

数据源Sources、目标加载表Targets和采集清洗过程mapping等逻辑设计存放处。可以在designer模块添加存储库。
3.Workflow Manager--物理设计
会话session和工作流workflow设计。

4.Workflow Monitor--监控

监控工作流运行情况并记下日志。
三、范例
1.导入数据采集源表逻辑结构

2.导入目标加载表逻辑结构

3.创建mapping

source组件中设置采集语句。
lookup组件可以输入参数查询数据。
expression组件可以根据informatica函数对字段进行处理,例如是否为空isnull,类型转换等。
updates组件可进行新增、更新、删除操作。*需要指定目标表逻辑主键
router路由器可以进行分组。
filter可以进行筛选过滤留下符合条件的数据。
预处理可以在过程开始前运行sql语句。
后处理可以在过程完成后运行sql语句。
mapping参数需要以$$开头
4.创建session
session的参数以$开头,有特定的格式。如$ParamName,Name可以自己定义
需要在session中-编辑-配置对象下stop on errors中设置值为1,若为0则session出错不会停止运行

在session中-映射-连接中可以配置连接数据库的参数。

5.创建工作流
在工作流-编辑-属性下设置参数文件目录

将目标session拖入工作流中使用连接组件将启动和session连接。


编辑工作流中的session组件将如果任务失败,父项也失败 为✔

6.测试工作流
运行工作流
在Workflow Monitor下查看运行状况

可以查看运行日志

7.导出工作流文件
在Repository Manager下选中目标工作流(可多选)
右键导出就可以导出工作流包括依赖的session、mapping、source、target

转载于:https://www.cnblogs.com/Babylon/p/8492173.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Informatica是数据集成和数据管理软件的领先提供商,Hadoop是一个开源的分布式计算框架。Informatica Hadoop教程是指为使用Informatica软件进行Hadoop数据集成和管理的培训和指南。 Informatica Hadoop教程可以帮助用户了解如何使用Informatica软件与Hadoop整合,以实现更高效、更灵活的数据处理和分析。教程通常包括如何安装和配置Informatica组件和Hadoop集群,以及如何使用Informatica PowerCenter来连接和操作Hadoop集群中的数据。 在教程中,学习者将学会如何使用Informatica的图形化界面来设计和执行数据抽取、转换和加载(ETL)流程,并将数据从Hadoop集群中的不同数据源移动到目标系统。教程还会介绍如何进行数据清洗、数据转换和数据聚合等数据处理操作。 此外,Informatica Hadoop教程还会介绍如何优化和调整Informatica作业以实现更好的性能,并介绍如何使用Informatica的监控和管理工具来监视和管理Hadoop集群中的作业。 通过完成Informatica Hadoop教程,用户将能够熟练地使用Informatica软件来处理大规模的数据,并能够利用Hadoop分布式计算的优势来实现更快速、更高效的数据处理和分析。这对那些需要处理大数据量的企业和组织来说是非常有价值的。 总结来说,Informatica Hadoop教程提供了一种学习如何使用Informatica软件和Hadoop集群进行大数据集成和管理的方法,帮助用户更好地利用大数据的价值和潜力。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值