talend连接数据库抽取数据保存为csv
ORACLE数据库连接
使用talend etl工具抽取oracle数据库数据,使用到的组件为tOracleInput。
tOracleInput连接配置
- 数据库版本 ,选择目标数据库版本,楼主自己使用连接时,选择的是“ **Oracle 11 **”
- 主机 ,选择目标数据库主机地址,如192.168.131.132
- 端口 ,选择目标数据库主机地址端口,默认1521
- 数据库 ,选择目标数据库名,如TALEND
- 用户名 ,选择目标数据库用户名,如username
- 密码 ,选择目标数据库密码,如password
- 查询 ,编写查询语句,如select * from table
tMap设置
对抽取的数据可以处理,可以通过tMap组件。
1 设置临时数据保存路径
双击tMap组件,进入设置:
设置界面主要分三大块:源数据列,表达式列,目标数据列
- 点击左下角 + 键 ,增加源数据列
- 点击右上角 + 键 ,开始创建目标数据列
- 点击右下角 + 键,创建具体数据字段
模式一:所有字段抽取
想要抽取查询结果的所有列,只需增加一个数据字段,具体如下:
增加一个源数据字段,字段名填写为 all 。通过鼠标拽拉的方式,将源数据列的all字段,拖到目标数据列,完成
模式二:部分字段抽取
假设查询结果得到20个字段数据,实际上只需要抽取其中的几个字段,需要我们自己写入抽取的字段名称,或者在连接数据库配置 "查询" 中写明实际需要查询的语句。
前者如下进行设置:增加10个数据字段。同时将源数据列全选通过鼠标拽拉到目标数据列,完成
其他操作:
1 增加新数据字段
2 删除数据字段
3 将某个数据字段的位置上移
4 将某个数据字段的位置下移
5 修改目标列字段名,如将“newColumn8”列名改为“newname8”
模式三:增加额外字段
实际工作中,我们还需要加入一些源数据不存在的字段
例如,需要说明源数据库和表。故需要在目标数据列增加两个新字段,分别命名为“ SourceDatabase ”," SourceTable ";显式设置字段数据为“ TALEND “,” TableName "
保存为csv文件
将结果保存为csv文件,使用 tFileOutputDelimited 组件。
tFileOutputDelimited 设置
根据需要,选择保存路径,行分隔符,和列分割符
一个简单的从oracle数据库抽取数据并保存为csv文件的任务创建完成!
组件之间使用主线模式连接。单击组件右键选择 “行——主线” 连接,即顺序执行。