[Kettle] CSV文件输入

CSV(Comma-Separated Values)文件是以字符(大多数使用逗号,)分隔值,以纯文本形式存储数据的文件

数据源

语文成绩(kettle数据集1).csvicon-default.png?t=N7T8https://download.csdn.net/download/Hudas/87356192?spm=1001.2014.3001.5501

1.建立【CSV文件输入】转换工程

使用Ctrl + N快捷键,创建【转换1】转换工程,选择【核心对象】|【输入】|【CSV文件输入】组件,将其拖曳到右边工作区中

2.设置【CSV文件输入】组件参数

双击工作区中的【CSV文件输入】组件,弹出【CSV文件输入】窗口,设置相关参数

基础参数说明

1.步骤名称:表示CSV文件输入组件名称,在单个转换工程中名称必须唯一,默认值为"CSV文件输入"的组件名称

2.文件名:表示读取源数据的CSV文件名称,单击"浏览"按钮,选择对应的csv文件

3.列分隔符:表示每个数据之间的分隔符,默认值为英文逗号,

4.封闭符:表示封闭起一个数据、保持其完整性的一对符号,默认值为英文双引号"

5.NIO缓存大小:表示定义Java读取文件缓冲区的大小,默认值为50000

6.简易转换?:表示是否启用简易转换。如果选择了简易转换,那么可以尽可能避免不必要的数据类型转换,从而显著提高性能。默认为勾选

7.包含列头行:表示源文件是否包含有列名(字段名称)的标题行。默认勾选

8.将文件添加到结果文件中:表示是否将文件名添加到结果文件中。默认不勾选

9.行号字段:表示在组件输出字段名称时包含行号,可选项。默认值为空

10.并发运行?:表示在读取多个文件时,根据文件大小来划分其工作负载;选择并发,可提高读写速度。默认不勾选

11.字段中有回车换行?:表示字段中是否有回车换行符。默认不勾选

12.格式:表示DOS、Unix和mixed 3种格式的文件。默认值为mixed混合模式

13.文件编码:表示文件使用的编码,使用下拉框选择编码。默认值为空

字段参数说明

1.名称:表示CSV文件的字段名称

2.类型:表示字段的数据类型

3.格式:表示原始字段格式的可选掩码

4.长度:表示字段长度

5.精度:表示数字类型字段的浮点数的精确位数

6.货币符号:表示货币符号,例如"¥"、"€"和"$"等货币符号

7.小数点符号:表示小数点符号,一般用英文点号.

8.分组符号:表示数值分组符号,一般用英文逗号,

9.去除空格类型:表示去除空格,适用于字符串

在"CSV文件输入"对话框中,设置有关参数,获取"语文成绩.csv"文件中的数据

弹出"Sample data"对话框,点击【确定】按钮,导入"语文成绩.csv"文件的字段到字段参数表中

对上述字段参数进行修改编辑

编辑修改完参数后,点击【确定】按钮,完成组件参数的设置

3.预览数据

我们也可以点击CSV文件输入对话框中的【预览】按钮,预览展示CSV文件输入的数据

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Kettle是一款用于数据集成的开源工具,可以进行数据的抽取、转换和加载。在Kettle中,可以使用CSV文件作为输入和输出源。引用中提到了KettleInput文件夹,其中包含了当前案例的所有数据输入,包括txt、CSV、gz、xls等格式的文件。因此,您可以将CSV文件作为输入源来进行数据处理。 另外,关于KettleCSV输入和输出,需要注意以下几点: 1. CSV输入:在Kettle中,可以通过使用CSV文件输入步骤来读取CSV文件。您可以选择指定CSV文件的路径和格式,并配置文件的分隔符、文本限定符等选项。然后,可以通过连接到其他转换步骤来处理这些输入数据。 2. CSV输出:同样,在Kettle中,可以使用CSV文件输出步骤将数据导出为CSV文件。您可以指定输出文件的路径和格式,并选择分隔符、文本限定符等选项。然后,可以将数据从其他转换步骤传递给CSV输出步骤,并将其写入CSV文件。 对于KettleCSV输入和输出,您可以在Kettle的转换设计界面中找到相应的输入和输出步骤,按照需要进行配置和使用。如果在使用Kettle过程中遇到问题,可以参考引用中提到的解决方法,并确保驱动包的完整性。 总结起来,Kettle可以通过CSV文件进行数据的输入和输出,您可以使用CSV文件作为输入源,并通过CSV文件输出步骤将数据导出为CSV文件。在Kettle的转换设计界面中,您可以找到相应的步骤来进行配置和使用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值