kettle spoon excel

本文介绍了使用Kettle Spoon ETL工具从Oracle数据库中抽取500万条数据到Excel时遇到的问题。在尝试本地处理时,发现效率仅为40条/秒,但在服务器上运行脚本后,速度提升至每分钟4万条。然而,当数据超过Excel 2003的最大行数限制65536时,出现了错误。通过更改输出格式为Excel 2007并启用Stream XLSX DATA选项来支持大文件写入,但最终遇到了内存溢出问题。
摘要由CSDN通过智能技术生成
使用kettle spoon etl 工具将oracle中大表抽取到excel中
因为数据库表中有clob字段,整个表数据量500万左右,表大小有5.3G,
根据业务需求将数据准备到另外新的表中,create table * as select ***。这样kettle查询速度快点,避免一堆关联查询。
然后采用本地kettle 编辑好脚本,测试发现本地抽取到excel效率 只有40条/秒
果断放到服务器上面跑kettle的脚本。喜由天降,每分钟4w条的速度还是可以接受的。160w数据轻松导出!
但是有遇到一些问题,数据导出超过65536条就报下面错误:
[root@hz_gg57 dmb]# sh run_nielsen.sh 
run_nielsen.sh: line 1: #!/bin/sh: No such file or directory
2016/07/08 12:54:54 - Kitchen - Start of run.
2016/07/08 12:54:54 - RepositoriesMeta - Reading repositories XML file: /home/data-integration/.kettle/repositories.xml
2016/07/08 12:54:57 - JOB_export_nielsen_info - Start of job execution
2016/07/08 12:54:57 - JOB_export_nielsen_info - Starting entry [export_nielsen_info]
2016/07/08 12:54:58 - Trans_export_nielsen_info - Dispatching started for transformation [Trans_export_nielsen_info]
2016/07/08 12:55:38 - 获取nielsen_info数据.0 - linenr 50000
2016/07/08 12:55:38 - Excel输出.0 - linenr 50000
2016/07/08 12:55:50 - Excel输出.0 - ERROR (version 5.1.0.0, build 1 from 2014-06-19_19-02-57 by buildguy) : Error writing field (0,65536) : jxl.write.biff.RowsExceededException: The maximum number of rows permitted on a worksheet been exceeded
2016/07/08 12:55:50 - Excel输出.0 - ERROR (version 5.1.0.0, build 1 from 2014-06-19_19-02-57 by buildguy) : jxl.write.biff.RowsExceededException: The maximum number of rows permitted on a worksheet been exceeded
2016/07/08 12:55:50 - Excel输出.0 -     at jxl.write.biff.WritableSheetImpl.getRowRecord(WritableSheetImpl.java:1214)
2016/07/08 12:55:50 - Excel输出.0 -     at jxl.write.biff.WritableSheetImpl.addCell(WritableSheetImpl.java:1151)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值