目录
主要介绍第一个工作流的创建、预览、启动过程,这条数据流将本地文件中的数据进行处理,最终将处理过的数据存放到本地磁盘上(streamsets 运行在CentOS7上)。
参考:
StreamSets实战之路(五)-基础篇- StreamSets开启第一个数据流
问题:
1.Field Remover没有待选字段
场景
将满足条件1的数据记录进一步处理,不满足条件1的数据记录扔了;从组件选择区选择一个记录过滤插件和一个垃圾桶插件,并将上一个插件的1输出连接记录过滤插件,2输出连接垃圾桶插件;
已经做了的操作:
- 文件目录插件,并配置该插件,设置读取的文件目录、文件类型、输入到streamsets 中的文件格式
- 上传了例子中的文件
问题截图:
2.预览的数据含义
json文件中有68条数据,预览中有很多个record,这些record的记录不全相同
预览的数据(没展开)
展开