作者:Elisabeth Richter Sasha Rezvina翻译:陈之炎
校对:欧阳锦
本文约5100字,建议阅读10分钟
本文为您展示了KNIME分析平台的用户界面,解释了其关键功能,在展示友好的KNIME分析平台的同时,演示如何创建一个无代码的数据科学项目。
标签:KNIME分析平台
概述
近年来,数据科学在我们的日常生活中无处不在,许多数据分析工具得以萌芽和发展,供数据科学家使用。Python、R或KNIME分析平台是最常见的数据分析工具。KNIME分析平台包含了可视化编程环境和直观界面等技术在内的具有创新特质的诸多特点。
在本博中,为您展示了KNIME分析平台的用户界面,解释了其关键功能,在展示友好的KNIME分析平台的同时,演示如何创建一个无代码的数据科学项目。为此,将采用一个具体的例子来实现基于k-Means聚类过程的客户细分工作流程。
常用概念:节点、工作流和组件
KNIME分析平台是一个免费的,开源的软件,贯穿于整个数据科学的生命周期。KNIME的可视化编程环境不仅提供了访问、转换和清洗数据的工具,而且还可以训练算法、执行深度学习、创建交互式可视化等等。
KNIME分析平台的用户界面也可称为工作台,其典型组织方式如图1所示。
图1.KNIME工作台概述
节点执行数据科学过程中的任务
使用“节点”组装一个可视化的工作流,节点在KNIME分析平台中显示为一个彩色的方框,可执行一个独立的任务。相互连接的节点集合构成了工作流,代表部分或全部数据分析项目。
单个节点都可以执行各种任务,例如,读写文件、转换数据、训练模型,或创建可视化。可以在节点存储库中找到(在左下角)不同类型的节点。数据通过输入端口和输出端口在节点间实现路由。单个节点可以有数据输入或数据输出,也可以有其他对象,如机器学习模型、SQL查询或数据属性,对象专用输入端口或输出节点,相同类型的端口之间可以实现互联。节点根据其类别进行颜色编码,例如,所有黄色节点都用于数据整理。根据各自的任务,对节点进行特定的设置,可以在其配置对话框中调整节点的设置。
每个节点下面有一个简单的交通灯系统,显示该节点是否已经配置、已执行,或者是否发生了错误。
图2.单个节点的不同状态
用节点、元节点和组件组装工作流
KNIME分析平台中的工作流由多个节点组合而成。互联的数据节点从左到右流过工作流。
可以使用注释——自由放置在工作流中的彩色框架来记录工作流中的步骤。
图3.利用k-Means聚类过程执行客户细分的简单工作流程。工作流的任务、读取数据预处理的每个步骤以及应用k-Means可视化都记录在注释框中
还可以在工作流中识别孤立的逻辑操作块,并将这些节点包含到所谓的元节点或组件中。组件和元节点一样,不是为了更加透明而对某些节点进行分组,而是封装和抽象了逻辑块的功能。组件与节点具有类似的用途,而元节点更像是对视觉外观的改善。
通过扩展和集成可用资源来丰富功能
除了上述功能外,KNIME分析平台还有两个重要的元素——扩展和集成。各种扩展和集成为KNIME的核心功能提供了附加的功能。例如,KNIME深度学习-Keras集成或文本处理扩展只是众多扩展中的两种。
最后,再说几句关于在哪里获取帮助和资源的话。</