Palladian 扩展 中有什么节点值得使用呢?
Palladian 是一个基于 Java 的工具包,它有一些 Internet 信息检索的节点。还有一些用于文本处理的节点。
他的付费方式比较特别: 如果您使用的是 KNIME AP 版本, 那么这个扩展就是免费的,如果你使用的是 KNIME Server/Hub 那么就是需要付费许可的
安装
这个扩展原来是存在于 KNIME community extension 中, 后来因为包含了一些付费内容,所以放在 NodePit 上。 它的安装方法比较简单,和普通的 KNIME 官方扩展相比,需要一些额外的步骤。
-
在 KNIME 的选项中, File → Preferences → Install/Update → Available Software Sites ,单击 Add... 并粘贴更新站点。确保更新站点与您当前的 KNIME 版本匹配,例如 https://download.nodepit.com/4.7 对应于 KNIME 4.7 版本, 如果您 KNIME 是其他版本的,需要做相应的调整
-
按照正常的搜索安装 KNIME 扩展流程就可以下载安装了
节点简单介绍
这个扩展的节点主要分为:
-
Classification 分类 -
Extraction 提取 -
Geo 地理 -
Images 图片 -
Scoring 评分 -
Testing 测试 -
Web 网络
几个部分。基本上通过这些分类就知道里面有些什么功能节点了。
![alt](https://i-blog.csdnimg.cn/blog_migrate/f8c3a3b6f2362c712ea5fc0c53f34ce3.jpeg)
其中我用的比较多的是 Web 部分,尤其是 HTTP Retriever 相关节点。虽然 KNIME 也有 GET, POST 等节点,但在某些情况下,Palladian 的这些网络相关节点会更好用。比如,你获取了一篇页面,只想得到页面中的部分文字部分,那么你就可以使用 HTTP Retriever、HTML Node to Text、HTML Parser 等节点,最终以 XML 的形式进行处理。
另外有的朋友比较喜欢 Extraction 提取类别中的 Regex Extractor 正则表达式提取器, 对于正则表达式的使用的确更直观一点。
![alt](https://i-blog.csdnimg.cn/blog_migrate/8f508913b87594a4582e1fc4be919df9.jpeg)
再其他的,我就没有那么太日常使用了。
欢迎关注公众号:数据分析指北
本文由 mdnice 多平台发布